Тёмный

Как нейросеть научили читать тексты XVII века 

Яндекс
Подписаться 408 тыс.
Просмотров 367 тыс.
50% 1

Рукописи, может быть, и не горят, но точно ветшают и портятся. Понять, что написано в двухсотлетних документах, бывает непросто - и из-за их состояния, и из-за особенностей языка. Но на помощь приходят нейросети.
В прошлом году Яндекс запустил «Поиск по архивам». Это сервис, который помогает людям искать упоминания своих предков в архивных документах так же, как в интернете. Для этого команда обучила модель читать старинные тексты, и она уже распознала миллионы страниц.
👀 Попробуйте найти в архивах корни своей семьи: yandex.ru/archive
Это рубрика «Вопрос со звёздочкой», в которой разработчики Яндекса простым языком объясняют сложные технологии. Татьяна Сапатова занимается распознаванием текста в Яндексе и, в частности, в «Поиске по архивам». В «Вопросе со звёздочкой» она рассказывает об особенностях дореформенной орфографии и поиске по старинным записям, которые раньше могли читать только эксперты.
#поискпоархивам #технологии #нейросети #it #яндекс #генеалогия
тайм-коды:
00:00 - Что такое «Поиск по архивам»
00:46 - Огонь, вода, титло и другие сложности распознавания
01:39 - Как эксперты учили нейросеть читать
02:37 - Как модель находила слова в узорах
03:22 - Планы на будущее

Наука

Опубликовано:

 

19 июн 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 52   
@val4521
@val4521 28 дней назад
Да я и свой подчерк не всегда потом распознать могу, что уж говорить про чужие
@gametraveleryt
@gametraveleryt 28 дней назад
Жиза
@rwr518
@rwr518 23 дня назад
Почерк
@shabbytie21925
@shabbytie21925 28 дней назад
Ждём пока нейронка научится распознавать рецепты врачей
@TheBirdOfDesire
@TheBirdOfDesire 22 дня назад
И речь машинистов электричек
@abstinentelven
@abstinentelven 28 дней назад
А как же тëтенька в архиве, у которой каждый прогон сканера стоит от 100 рублей?
@katerinavikhoreva
@katerinavikhoreva 4 дня назад
Пользовалась сервисом) Очень увлек🤗 Смогла найти не все данные, конечно, но понимаю, что оцифровка еще продолжается. Спасибо вам огромное за то, что делаете такие крутые вещи и за то, что они бесплатные!🥰
@user-zo4hw6wt4z
@user-zo4hw6wt4z 28 дней назад
Спасибо за сервис ❤
@yandex
@yandex 28 дней назад
❤️🙌
@MishaGoncharov
@MishaGoncharov 28 дней назад
Вот только свой документ не закинуть в этот сервис... Вот у меня есть свидетельство о браке 1920го года, кого-то из родственников. Но я не могу прочитать.. В поиске его не находится. Приходится искать другие сервисы по распознаванию, но качество у них по-моему похуже.
@nemodendi
@nemodendi 28 дней назад
Очень симпатичная девушка всё коротко и понятно объяснила, спасибо за видео и за сервис.
@yandex
@yandex 22 дня назад
@yguzik
@yguzik 28 дней назад
В первую очередь интерес вызывают описи документов которые ждут оцифровки. Ведь не в одном архиве оцифровку вели).
@AleksanderChuikov
@AleksanderChuikov 28 дней назад
У вас список архивов расположен в неудобном порядке. Лучше на первое место поставить название региона, а потом всё остальное
@alex_prav
@alex_prav 28 дней назад
Саша, попробуй найти в сервисе "оставить отзыв" или что то на подобии такого
@AleksanderChuikov
@AleksanderChuikov 28 дней назад
@@alex_prav ок
@realamour2856
@realamour2856 28 дней назад
Учат нейросети всякой сложной херне, сперва научите ваши нейросервисы не ломаться, как ни зайдешь в браузер, переводчик не работает, помощник не работает, завтра снова работает что то одно из двух, послезавтра работает все, еще через день нихера не работает, переустановил браузер, та же херня. Начал гуглить и узнал, что у кучи людей та же беда.
@vlabangog
@vlabangog 26 дней назад
Незнай, пользуюсь сервисами Яндекса уже около 3-ёх лет, за всё это время Яндекс Музыка только отваливалась пару раз
@her0189
@her0189 20 дней назад
Отправьте пожалуйста мой заказ, месяц уже лежит
@TheBirdOfDesire
@TheBirdOfDesire 22 дня назад
Насколько же вы крутые! 😍
@yandex
@yandex 22 дня назад
Спасибо за поддержку, приятно читать такое ❤️
@WithoutNumbers
@WithoutNumbers 22 дня назад
​@@yandex Было бы также приятно прочитать ответ на удаленные комментарии по теме нахождения Яндекса в Диспетчере задач даже после отключения пункта «Разрешить работу в фоне» на странице настроек: значок меню (≡) → Настройки → Системные → Автозапуск и фоновый режим после закрытия браузера. В итоге кстати удалось избавиться от автоматического запуска Алисы при старте системы, несанкционированного и неуправляемого поведения Яндекса в ОС, сейчас нагрузки на систему нет, хотя сам браузер не удален, лишь два файла - "service_update.exe". Все это напоминает вирус, майнер или хакеров, особенно после удаления переписки, словно мошенничество, реально скам какой-то. Такое ощущение и осадок остается после всего увиденного.
@yandex
@yandex 22 дня назад
Ваш комментарий видим! Совсем скоро ответим.
@yandex
@yandex 22 дня назад
Голосовой помощник Алиса интегрирован в Яндекс Браузер и упоминается в названии программы, но это не означает, что он включён. Все процессы браузера называются Yandex with voice assistant Alice или «Яндекс с голосовым помощником Алиса». Работающие в фоновом режиме процессы помогают Яндекс Браузеру открываться быстрее. Попробуйте, пожалуйста, отключить опцию в настройках: меню ≡ → Настройки → Системные → Производительность → Ускорить запуск браузера.
@WithoutNumbers
@WithoutNumbers 22 дня назад
@@yandex Спасибо за предложение с пояснения и простите за беспокойство. Что касается самого вопроса, на данный момент смог добиться исчезновения элементов Яндекс из Диспетчера задач после закрытия браузера удалив файл "service_update.exe" в двух папках. Необходимость ручного обновления никак не мешает в сравнении с неконтролируемым поведением фоновых процессов и так или иначе это единственно что сейчас сработало, а в будущем, если и это поломается, что ж, значит опять буду читать субтитры из обучающих видео на иностранных языках. Возможно людям на топовых ПК эти процессы на фоне не заметны и это не является для них проблемой, но не у всех под рукой топ железо, чтоб обеспечивать различному софту постоянное потребление ресурсов системы или связь с интернетом, хотя конечно ваши безопасники могут поспорить, я не технарь в IT по образованию. Пункт "Производительность" и опции "Обновлять Браузер, даже если он не запущен" и "Ускорять запуск Браузера" уже нашел самостоятельно по видео, которые записывают люди последние 4 года пытаясь как-то решить этот вопрос с фоновыми процессами. Так что думаю можно закругляться, благодарю за потраченное время и поддержку. Теперь и я могу сказать, что вы крутые, раз уделяете столько внимание своим пользователям!
@MrGidella
@MrGidella 27 дней назад
Когда вы договорились с РГАДА, где и хранятся все эти тексты, без этого толку от ваших технологий, основной корпус данных там.
@playinlifecom
@playinlifecom 27 дней назад
после просмотра этого видео врачи совсем расслабятся
@gametraveleryt
@gametraveleryt 28 дней назад
Ура видео
@yandex
@yandex 28 дней назад
@WithoutNumbers
@WithoutNumbers 23 дня назад
@@yandex Смотрите, есть видео - "19 яндекс браузеров в Диспетчере задач" и там ваша компания 4 года назад с этого аккаунта оставила ответ, цитата: "@yandex 4 года назад Здравствуйте! Несколько процессов браузера, которые вы видите в диспетчере задач компьютера, возникают из-за включенных у вас расширений и открытых вкладок. Все браузеры на основе Chromium (в том числе Google Chrome и Opera) работают подобным образом и создают отдельный процесс для каждого приложения или вкладки браузера. Количество потребляемой оперативной памяти зависит от того, какие вкладки открыты у вас в данный момент и какие расширения используются." Вопрос в следующем - Как сделать так, чтобы после закрытия вашего браузера, все эти вкладки, несколько десятков, исчезли из Диспетчера задач и браузер после закрытия не потреблял ресурсы системы? Для тех, кто не в курсе - Приходится убирать процессы Яндекса вручную, выбирать по одному элементу из списка и нажимать на кнопку "Снять задачу", это ужасно неудобно, долго и муторно, ведь не всегда с первого раза получается завершить процесс. Почему ваш браузер сам целиком и полностью до сих пор не закрывается окончательно, как это происходит в других браузерах? Это так сложно реализовать? Единственна причина, почему многие все еще держат ваш Яндекс браузер в системе и закрывают все вручную таким неудобным образом - это возможность аудио перевода некоторых видео на Ютубе. Поэтому, когда у самого Ютуба, Гугл или других компаний будет такой ИИ, то Яндекс будет удален окончательно, чтобы не нагружать систему скрытыми и неконтролируемыми процессами в системе, которые используют ресурсы памяти, дисков SSD, процессоры и тд. У SSD и NVMe такое вообще неприемлемо, когда что-то постоянно записывается, считывается, висит и тормозит. 2024 год и эта мелочь все ще не исправлена, просто жесть, учитывая какими возможностями обладает ваша компания и тот факт, что у других браузеров этой проблемы нет.
@yandex
@yandex 22 дня назад
Здравствуйте! Попробуйте, пожалуйста, отключить пункт «Разрешить работу в фоне» на странице настроек: значок меню (≡) → Настройки → Системные → Автозапуск и фоновый режим. Функция обеспечивает работу браузера в фоновом режиме и активность некоторых фоновых расширений после закрытия браузера.
@gametraveleryt
@gametraveleryt 22 дня назад
@@yandex хорошо :)
@gametraveleryt
@gametraveleryt 22 дня назад
@@yandex а в каком приложении?
@user-qt7nu6gc2s
@user-qt7nu6gc2s 20 дней назад
Здравствуйте почему когда нажимаешь скачать картинку то не скачивается а открывается всё фото
@yandex
@yandex 20 дней назад
Здравствуйте! Пожалуйста, расскажите подробнее о ситуации. Правильно понимаем, что вы говорите о скачивании изображения в десктопной версии Яндекс Браузера?
@user-qt7nu6gc2s
@user-qt7nu6gc2s 20 дней назад
Я говорю про то что когда вводишь запрос и открываешь раздел картинки выбираешь то что нужно и нажимаешь скачать то ничего не скачивается а просто открывается фото на полный экран
@yandex
@yandex 19 дней назад
Спасибо за уточнение! Ваш вопрос не теряем, скоро вернёмся.
@user-qt7nu6gc2s
@user-qt7nu6gc2s 19 дней назад
Спасибо
@yandex
@yandex 19 дней назад
Мы убрали возможность скачать изображение из Картинок, чтобы не нарушать авторское право на интеллектуальную собственность. Скачать картинку можно на сайте-источнике: под картинкой выберите «Скачать» → она откроется на сайте → нажмите на неё и удерживайте → Скачать или Сохранить изображение.
@fleeshka4896
@fleeshka4896 28 дней назад
Как круто!
@arch6544
@arch6544 26 дней назад
не знал, что в Яндексе работает бывшая жена Эдварда Билла
@user-yx6fd5ht3h
@user-yx6fd5ht3h 26 дней назад
у яндекс есть 1 - то что их нету
@user-gz7qc4hf5h
@user-gz7qc4hf5h 28 дней назад
Яндекс пробил очередное дно
@user-wu5tt3fy5w
@user-wu5tt3fy5w 27 дней назад
В Яндексе жирных много
@user-eq2eq3wz4m
@user-eq2eq3wz4m 26 дней назад
Никакой у вас культуры нет
@vlabangog
@vlabangog 26 дней назад
Ты походу не отличаешь жирных от пышных. Именно эта девушка пышная, красивая, приятная на голос, вызывает симпатию и не побоюсь этой фразы "есть за что ухватиться". К жирным её ни как не отнесёшь.
@WithoutNumbers
@WithoutNumbers 23 дня назад
А в интернете тупых
Далее
Проверил на логику певца L’one
00:17
Skins from the FUN&SUN collection | Standoff 2 (0.29.0)
01:10
стажировка в яндексе [говорим]
20:36
КАК УСТРОЕН PNG-ФАЙЛ?
36:46
Просмотров 294 тыс.
Как бы выглядел человек в 4D?
14:14
ЕГЭ РУССКИЙ ЯЗЫК №27
9:17
Will the battery emit smoke if it rotates rapidly?
0:11
iOS 18 превратилась в Android
0:49
Просмотров 869 тыс.