Обсуждаем устройство трансформеров и механизм внимания. Как появилась архитектура, на которой построены ChatGPT, Claude и Gemini? Почему предсказание следующего слова оказалось настолько мощной идеей и как оно изменило развитие AI? Говорим о природе интеллекта, различиях между человеком и LLM, а также о том, почему способность предсказывать следующее слово приводит к поведению, которое выглядит разумным.
Разбираем, как трансформеры помогают анализировать ДНК и как такие системы могут использоваться для персонализированной медицины. Говорим о будущем ИИ: почему эпоха масштабирования может подходить к концу, какие ограничения есть у современных моделей и каким может стать следующий этап развития искусственного интеллекта.
▶︎Naukka Talents – платформа для поиска талантов и найма STEM-специалистов в deep-tech и biotech проекты. Подать заявку кандидата: https://postnauka.org/link/nt_scast
▶︎Следите за ПостНаукой на других площадках: https://postnauka.org/link/linktr_scast
▶Курсы от создателей ПостНауки: https://postnauka.org/link/academy_scast
▶Поддержать ПостНауку: https://postnauka.org/link/donate_scast
▶По вопросам партнерства — коммуникационное агентство ПостНаука.Specials: https://postnauka.org/link/letsdance_scast
Тайминги выпуска:
О чем этот выпуск?
Как появились современные большие языковые модели
Тройственный союз: нейросети, символы и эволюция
Предыстория Attention Is All You Need
Проблема памяти до появления трансформеров
Что такое self-attention
Почему диалог сложнее машинного перевода
Как появились BERT и GPT
Создали ли мы искусственный интеллект?
Могут ли LLM навредить человечеству?
Почему AI делает контент вместо научных прорывов
Главная проблема трансформеров — длинный контекст
Как работает Recurrent Memory Transformer
Зачем LLM контекст на 50 миллионов токенов
Как превратить ДНК в язык для ИИ
Зачем изучать ДНК?
Зачем ИИ читать геном целиком?
Может ли ИИ прочитать весь геном человека?
ИИ против устойчивых бактерий
Без науки нет будущего
Заключение


