Тёмный

Базы данных LSM tree 

Sergey Nemchinskiy
Подписаться 360 тыс.
Просмотров 14 тыс.
50% 1

Владимир Кузнецов. Описание способа хранения данных на основе log-based структур. LSM tree. Bloom Filter. Особенности реализации, сильные и слабые стороны этого подхода. LevelDB

Опубликовано:

 

5 окт 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 31   
@AntonM-z7s
@AntonM-z7s 5 лет назад
ну не меняйте камеру каждые 3 сек! укачивает же)
@naaawaaa
@naaawaaa 3 года назад
Почти дословный пересказ про SSTable и LSM деревья из главы 3 книги Data Intensive Applications. Пришел оттуда, чтобы углубиться в тему, но тут только картинки другие
@Влад-Донцов
@Влад-Донцов 2 года назад
Я тут только потому что хочу укрепить эту главу ;)
@brostver
@brostver 5 лет назад
Как обычно всё отлично! Только надеюсь с лишней подвижностью камеры вопрос решится к след. выпуску. В остальном шикарно. Особенно замечаю как материал оживает как только сказали кем применяется структура.
@markchesnavsky3273
@markchesnavsky3273 Год назад
Шедевральное объяснение. Спасибо!
@НайманКопеев
@НайманКопеев 2 года назад
Не могу отделаться от ощущения, что Максим Галкин рассказывает очень круто об алгоритмах))
@obivanbeluii
@obivanbeluii 10 месяцев назад
Хорошее обьяснение, спасибо
@alexfilus
@alexfilus 3 года назад
Жаль тема с bloom filter не раскрыта подробнее
@Oleg77777100
@Oleg77777100 5 лет назад
Не, с камерой хорошая работа. Она компенсирует размеренность Владимира, тонизирует, бодрит. Динамика нужна сохранять внимание на видео, держать зрителя. Типа экшн, как Форсаж:) Даже будучи уставшим его можно продуктивно смотреть
@ivanjohn2916
@ivanjohn2916 4 года назад
Круто! Спасибо. Создание, Обновление, Чтение - объяснили, а вот что там с Delete и тем как эти значения живут на нижних уровнях LSM?
@vladymyrkuznietsov8815
@vladymyrkuznietsov8815 4 года назад
Для удаления просто пишем специальное значение "могильный камень" для ключа. И фоновый процесс при мержде все подчистит.
@gijduvon6379
@gijduvon6379 4 года назад
@Sergey Nemchinskiy я вот все понять не могу. Эти сруктуры используются для собственно хранения данных или для построения индексов?
@michaeldevichenskiy4588
@michaeldevichenskiy4588 5 лет назад
Это нужно! Помогите понять с чего начать?
@moaddib666
@moaddib666 4 года назад
Доброго времени суток, не совсем понятно почему на слайде с уровнями при переходе с L1 на L2 мы разбиваем подмножество M-Z на более мелкие которые включают в себя A-F G-L, откуда они взялись ?
@meef3r
@meef3r 4 года назад
M-Z -> A-F = "ma", "mb",..., "ze", "zf" M-Z -> G-L = "mg", "mh" ,..., "zk", "zl"
@kalmyk
@kalmyk 2 года назад
starcraft!!
@vladymyrkuznietsov8815
@vladymyrkuznietsov8815 5 лет назад
Эх... Не все баги выловил: для 99% правдивости блум фильтру надо дать 10 БИТ на элемент...
@РайанКупер-э4о
@РайанКупер-э4о 4 года назад
А как же бинпоиск?
@владимирсенцов-р1ю
Было бы интересно узнать. Есть ли профит с последовательной записью при использовании ssd?
@vladymyrkuznietsov8815
@vladymyrkuznietsov8815 5 лет назад
С SSD все проще, чем с жесткими дисками. Они вроде как сами организуют log на уровне firmware при записи, для них это важно, так как они трут и пишут большими кусками... Но операционка дает им команды как для жестких дисков , типа "запиши это в блок номер 4543434". Так что SSD приличного производителя скорее всего сам поймет, как писать быстро... но лучше лишних ребусов не задавать :)
@владимирсенцов-р1ю
@@vladymyrkuznietsov8815 Ну понятно. Кашу маслом не испортить. Тут просто интересно, являеться ли SSD хорошим Random Access в отлчие от HDD или все же последовательная запись намного предпочтительнее?
@vladymyrkuznietsov8815
@vladymyrkuznietsov8815 5 лет назад
@@владимирсенцов-р1ю Скажем так, для SSD ОБЫЧНО это далеко не так актуально, как для диска, разница всего на один порядок ;). Но с SSD свои погремушки, у них скорость гуляет в разы, в зависимости от обстоятельств. Там же очень много оптимизаций на уровне firmware. И работают они почти всегда хорошо :)... А чтобы всем было интереснее, то у разных производителей они разные...
@MrVlMor
@MrVlMor 5 лет назад
Ссд намного дороже хдд. А хдд ещё и расположены на сервере в каком-нибудь рейде
@mrvillst
@mrvillst 3 года назад
Укачивает, и скорость просмотра минимум 1,5 , а то прям тяжко смотреть
@amikawa2881
@amikawa2881 5 лет назад
Охуенно смотрю первые 7 минут 0 ассоциаций, 0 примеров, 0 иллюстраций, удачи в лекциях )))0
@konstantinkrigorov7228
@konstantinkrigorov7228 5 лет назад
Че он говорит ваще - ни вступления, ни сдравствуйте ни досвидания, ни о чём речь вобще...
Далее
Базы данных B-tree
19:28
Просмотров 23 тыс.
Базы данных log based
14:17
Просмотров 13 тыс.
would you eat this? #shorts
00:13
Просмотров 470 тыс.
The Secret Sauce Behind NoSQL: LSM Tree
7:35
Просмотров 204 тыс.
Реляционные базы данных
19:16
Просмотров 54 тыс.
would you eat this? #shorts
00:13
Просмотров 470 тыс.