я обучала одну модель
@def_model_trainShitposting on various subjects PS рекламы в канале нет
Посты канала (20)
- Моя любимая текущая конспирологическая теория из твиттера: claude mythos настолько силен в вопросах так сказать кибербе… 28.03.2026
- За неделю вышло несколько интересных новостей на стыке ML и нейробиологии: я про эксперимент, где мозг мухи загрузили в… 12.03.2026
- Другая поразившая меня часть этой хроники – это очень необычное понимание того, что такое демократия, высказанное многи… 08.03.2026
- Если вы еще не устали за неделю читать про противостояние Антропика и DoD, то я могу вам предложить вот этот отличный п… 08.03.2026
- Юдковский наконец-то победил в своей борьбе, и искусственный интеллект решил сам разбомбить датацентры 👍 02.03.2026
- Я в целом согласна с оценкой, что Суцкевер в своем интервью выдал примерно 3 бита информации, но что-то интересное отту… 27.11.2025
- Статья The Platonic Representation Hypothesis – одна из самых запомнившися мне за прошлый год. Если коротко, ее суть бы… 12.10.2025
- Пост без текста 13.08.2025
- Еще одна вещь, которая мне запомнилась с ACL: в своем keynote Luke Zettlemoyer упоминал умопомрачительные успехи RL, ко… 10.08.2025
- Самые интересные, на мой взгляд, статьи с ACL'25 🙃: - Training Dynamics Underlying Language Model Scaling Laws: Loss D… 02.08.2025
- Пока что лучшее что я видела в чатике с ACL 28.07.2025
- Очень конспирологическая статья Subliminal Learning: Language models transmit behavioral traits via hidden signals in d… 23.07.2025
- До ACL еще две недели, но у меня уже есть любимая статья https://arxiv.org/abs/2412.17533 10.07.2025
- было..... 16.06.2025
- Ну и пожалуй самый нетривиальный скрин из статьи 🤨 25.05.2025
- Параллельно с этим, в статье выдвигается гипотеза, что post-saturation generalization происходит во много благодаря том… 25.05.2025
- Reinforcement Learning for Reasoning in Large Language Models with One Training Example https://arxiv.org/pdf/2504.2057… 25.05.2025
- Reasoning Models Can Be Effective Without Thinking https://arxiv.org/abs/2504.09858 Уже писала парой постов выше, что м… 23.04.2025
- Интересная деталь была сегодня в стриме про gpt4.1 – одновременно с этим релизом, анонсировали депрекейшн gpt4.5 в API … 14.04.2025
- 🤔 There May Not be Aha Moment in R1-Zero-like Training — A Pilot Study - Здесь аналогичное наблюдение, что "Aha moment… 31.03.2025