Тёмный

Строим свой ИИ чатбот на основе кастомных данных используя OpenAI API и GPT Index 

Irina Nik
Подписаться 1,9 тыс.
Просмотров 32 тыс.
50% 1

Туториал по созданию ИИ с пользовательской базой знаний с использованием OpenAI API, GPTIndex и Langchain.
Техника была описана Dan Shipper www.lennysnews...
Код из видео: colab.research...
Хотите стать UX/UI дизайнером? Проходите курс: stepik.org/z/1...
#UXDesign #UX #UIдизайн #UXUIдизайн #вебдизайн

Опубликовано:

 

30 сен 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 71   
@dzzvin
@dzzvin Год назад
Спасибо! Возьметесь ли Вы за работу по созданию и интеграции чата ИИ на сайт?
@DamayitaDas
@DamayitaDas 11 месяцев назад
Функции из этого примера уже не работает, быстро устаревают. Приходится заменять новыми.
@Яестьчеловек-ш6ф
@Яестьчеловек-ш6ф 11 месяцев назад
Видно что этот урок написал очень опытный Senior или Middle разработчик. Как новичок скажу, спасибо что разобрались за нас и публиковали этот видеоролик
@vitalikgorohkov1896
@vitalikgorohkov1896 Год назад
правильно ли я понял, что вопросы которые мы можем задать ИИ, нужно прописывать заранее. Нельзя будет задать какой-нибудь вопрос, который не прописан в коде. Все правильно понимаю?
@KonsatntinPetrov
@KonsatntinPetrov 11 месяцев назад
конечно можно, тут просто для примера заранее прописано
@PrettyBetty-l1z
@PrettyBetty-l1z 9 месяцев назад
Спасибо за информацию. То что я долго искала. У Вас подробно, без лишней воды.❤
@Lexa-Live
@Lexa-Live Год назад
Как всегда топ контент! Не хотел программировать, но после этого видео, кажется придётся делать свой ИИ. Лайк, подписка, колокольчик!
@irina1nik
@irina1nik Год назад
свой ИИ всегда лучше чем чей-то чужой 😉
@EWLN
@EWLN Год назад
гуд идея, только делать ИИ с нуля тот еще гемор, просто посмотри у веритасиум разбор по тому как работает ИИ и машинное обучение, а так желаю всего самого лучшего!
@nataliasokolova2989
@nataliasokolova2989 9 месяцев назад
Спасибо! Очень полезный урок.
@alxxsterxx7802
@alxxsterxx7802 10 месяцев назад
Можно ли «скормить» ему несколько книг, и чтобы он давал ответы основываясь на идеях из этих книг ?
@InspireFrameShorts
@InspireFrameShorts 8 месяцев назад
Можно
@Randommmname
@Randommmname 11 месяцев назад
Как обойти ошибку openai.error.InvalidRequestError: This model's maximum context length is 4097 tokens, however you requested 4222 tokens? Хотя даю обычный запрос, не особо длинный
@_bigbro
@_bigbro 10 месяцев назад
так в API есть поле для установки лимита токенов, что-то вроде maxTokens=100
@bayanserik2430
@bayanserik2430 Год назад
И что дальше
@bayanserik2430
@bayanserik2430 Год назад
Index gpt должен постоянно должен включен ?!
@olegokhanov
@olegokhanov Год назад
Очень круто! Но тяжело понять без знаний разработчика. Есть кто-то, кто мог бы помочь (не бесплатно) разобраться как самому создать этот бот на основе своих данных?
@RedpaX
@RedpaX 11 месяцев назад
Вы серьезно? Я не знаю пайтон совершенно но пиши программы на пайтон, так как пишет их за меня ГПТ, а я только ТЗ ему выдаю.
@anisia26
@anisia26 11 месяцев назад
добрый день, может быть нашли кого-то? мне тоже актуально)
@VAPPARATAX
@VAPPARATAX 8 месяцев назад
@@anisia26вы нашли?
@RedpaX
@RedpaX 11 месяцев назад
Ну это просто бомба информация! Спасибо!
@sokov-andrey
@sokov-andrey Год назад
Ирина, подскажите, у вас не возникала проблема, с тем, что ответ возвращается не полным, обрезанным?
@Владимиртргамк
@Владимиртргамк 11 месяцев назад
НАДО ПРОЛИСТНУТЬ в право,там стрелочка такая треугольничек перевернутый на бок,и на вторую страницу перейдет,есть у них такой заскок
@georgetyndall7623
@georgetyndall7623 Год назад
у вас такой приятный голос 🤤
@Druzhishe7007
@Druzhishe7007 4 месяца назад
Сейчас уже используется новый API. Нужно использовать либо старый либо обновлять код под новый. Под новый у меня пока обновить не получилось, а вот откатился к старому API и код выполнился, индекс создался
@Druzhishe7007
@Druzhishe7007 4 месяца назад
я так понимаю gpt_inndex теперь фсё? И вместо него трудится llama_index.
@kisel13
@kisel13 Год назад
Подарите мне предобученную модель ChatGPT 3.5-turbo! Куплю видяху и ОЗУ больше и у меня будет личный ии!
@_bigbro
@_bigbro 10 месяцев назад
кхе. посмотри на цены видяхи на 256Гб. дешевле будет обучать в облаке.
@kisel13
@kisel13 10 месяцев назад
@@_bigbro Я лучше один раз заплачу
@anisia26
@anisia26 11 месяцев назад
Подскажите пожалуйста, какой Максимальный объем данных он может проанализировать?
@KonsatntinPetrov
@KonsatntinPetrov 11 месяцев назад
Тут нужно понять принцип работы, нельзя однозначно ответить на этот вопрос. Как базу знаний ему можно задать неограниченный объем, но сам чатгпт не имеет доступ к этим данным, и не видит картину целиком. В момент вопроса к нему, в базе знаний находятся несколько параграфов, которые скорее всего имеют отношение к вопросу. Далее эти параграфы отправляются самому чату вместе с вопросом пользователя. И на основе этой информации он даёт ответ. Как много нужной информации (параграфов из базы) можно отправить чату зависит от версии модели, но в целом не много.
@anisia26
@anisia26 11 месяцев назад
@@KonsatntinPetrov ну вот я загрузила большой объём, около 50 000 токенов, проанализировать не получилось нормально, он отвечал неправильно на вопросы по документу
@MotionCat
@MotionCat Год назад
спасибо за видео! супер контент!!!
@irina1nik
@irina1nik Год назад
Рада, что вам полезна эта информация. ИИ может стать помощником и взять на себя значительную долю рутинной работы. Я планирую серию роликов по работе с ИИ, буду рада обратной связи)
@АннаЛаврикова-н7в
Круто! Придется в этом разбираться))) Жду еще роликов!
@irina1nik
@irina1nik Год назад
Спасибо) В планах сделать видео на актуальные темы
@maximzhukv
@maximzhukv 6 месяцев назад
Здравствуйте, не подскажете, как исправить ошибку InvalidRequestError: The model `text-davinci-003` has been deprecated ?
@kostyarybalko3302
@kostyarybalko3302 6 месяцев назад
Ирина, ты можешь обновить код Construct an index? я не могу исправить ошибки которые там возникают из-за недостатка компетенций
@victorkravchenko511
@victorkravchenko511 Год назад
Спасибо большое, пойду обучать своего )
@dtaylor7798
@dtaylor7798 Год назад
Спасибо за видео. А как лучше это применять для данных на русском языке. Переводить на английский, потом в индекс? Или есть инструменты для создания индекса на русском?
@irina1nik
@irina1nik Год назад
С русским языком не экспериментировала ) по идее GPT должен и русский понимать, хоть и хуже. Попробуйте сначала без перевода, посмотрите что получится
@snixj4199
@snixj4199 Год назад
Здравствуйте, пробовали работать с данными на русском языке? GPT корректно работает?
@sadchenko
@sadchenko 10 месяцев назад
Спасибо, но пока все же не ясно как его интегрировать в качестве тех.поддержки в мой телеграм бот на PHP чтоб клиенты спрашивали про мои услуги к примеру, а Ai давал ответы на основе загруженной базы данных. В этой задаче ваш пример поможет?
@Doterra_myhealthpro
@Doterra_myhealthpro 9 месяцев назад
Возможно ли у вас заказать такой чатбот?
@wildberris4832
@wildberris4832 11 месяцев назад
Спасибо большое! Можно у Вас купить консультацию?
@kotik7493
@kotik7493 5 месяцев назад
Спасибо за видео! Вас очень приятно слушать
@ashakharov
@ashakharov 7 месяцев назад
я не понял, как это вчат бот запустить?
@RelaxPulse-gd3nj
@RelaxPulse-gd3nj 5 месяцев назад
Thank you!
@daniyarnugumanov987
@daniyarnugumanov987 5 месяцев назад
не работает скрипт
@квинтэссенцияневесомости
Спасибо за классный контент! Взял себе на заметку
@Владимиртргамк
@Владимиртргамк 11 месяцев назад
Все правильно сделано .организованно .
@LCH212
@LCH212 2 месяца назад
@vnr39
@vnr39 8 месяцев назад
Спасибо
@lunechkka4833
@lunechkka4833 10 месяцев назад
Вы можете разобрать голосового бота на ии и его этап обучение?
@walcermelodia
@walcermelodia 5 месяцев назад
Подкрути другую нейронку для генерации голоса на основе текста
@DamayitaDas
@DamayitaDas 11 месяцев назад
Душка 😇
@vladtamolov2292
@vladtamolov2292 Год назад
Слава тебе хорошая женщина. Записала отличное видео
@vit_avdeev
@vit_avdeev Год назад
Насколько большой объем своих данных можно задействовать? Скажем, у нас кастомный текст на 1 Гб, потянет?
@masterbiz100
@masterbiz100 Год назад
По логике, должен потянуть и больший объем. Просто он должен быть разбит на небольшие части в рамках установленного объема токенов для GPT. Просто смотрите по образцу - как там нужно делить большой файл и какого объема должны быть эти файлики
@Лисица-й6ц
@Лисица-й6ц Год назад
@@masterbiz100 как его разделить не совсем поняла
@RedpaX
@RedpaX 11 месяцев назад
@@Лисица-й6цвот именно, что значит разделить, если ответ должен парситься по всем данным сразу.
@anisia26
@anisia26 11 месяцев назад
Добрый день, Подскажите, удалось вам реализовать?
@KonsatntinPetrov
@KonsatntinPetrov 11 месяцев назад
@@RedpaX ответ не даётся по всем данным сразу, в этом и суть. Чату можно дать только маленькие кусочки информации, для этого ваш текст сначала разбивается на маленькие кусочки, а в момент вопроса к чату, ему в добавок с самим вопросом отправляется несколько кусочков, которые подходят скорее всего по логике.
@RedpaX
@RedpaX 11 месяцев назад
Я правильно понимаю, что каждый запрос для ГПТ будет добавлять данные из index файла и как следствие пожирать токены? То есть если у меня в index 400 символов то каждый раз к ГПТ будет идти «символы запроса пользователя+символы из index файла»? Если так то это бессмысленно абсолютно, мы всегда будем - 1 упираться в ограничение по символам в index файле, -2 сжигать деньги с бешеной скоростью так, как каждый наш запрос даже их 5 символов будет дополняться символами из index файла. Тогда получается что городить это смысла нет и проще действовать по старинке, отправлять нужные данные базы для ГПТ через первое сообщение и после уже не тратить токены в рамках одной сессии нового чата.
@wildberris4832
@wildberris4832 11 месяцев назад
Вы понимаете смысл "индекс базы данных"? Из всего вашего файла он и отправляет только нужный кусок, по индексу. Ну если у Вас книга на 300 страниц с данными Вы в жизнь не не отправите через прост. Поэтому все норм
@jachemcross
@jachemcross Год назад
А для использования API тоже надо использовать заграничный IP?
@kirill_monster
@kirill_monster Год назад
Нет
@RedpaX
@RedpaX 11 месяцев назад
Нет
@СетевойПромышленныйИнтеллектСП
Турта В.Г., 58 лет, автор научного открытия, мировой лидер в создании Промышленного ИИ. Первый в мире кибер-технолог, способный выполнять работу специалиста СЧПУ уже готов и выводится на рынок, пока, как обучалка. Рынок обучения СЧПУ по прогнозу чатГПТ более 5 миллиардов к 2025г. Дальше будет осваиваться рынок мелких собственников и затемм крупных компаний. В результате за 5-7 лет планируется создать компанию-триллионера. Как мне может помочь чатГПТ в маркетинге обучалки?
@Metastroy
@Metastroy 9 месяцев назад
Научиться формулировать вопросы понятно
@thekamchatnyy
@thekamchatnyy 8 месяцев назад
Добрый день, я могу интегрировать этот чат бот в инстаграм, телеграм или вотсап?
Далее
Ко мне подкатил бармен
00:58
Просмотров 165 тыс.
ХОККЕЙНАЯ КЛЮШКА ИЗ БУДУЩЕГО?
00:29
Ко мне подкатил бармен
00:58
Просмотров 165 тыс.