Итоги 2025 года. Год нашей команде
Прошло 357 дней с поста, в котором мы поздравляли всех с наступающим текущим годом. Тогда мы создали Пситехлаб. Посмотрим, что мы сделали за это время.
Прежде всего, мы сделали «Китобой», нашу антисуицид-платформу, которая шла к своему воплощению четыре года. Мы не постесняемся сказать, что получилась целая экосистема, потому что «Китобой» не только платформа, это еще и датасет, и модели, и куча программ-спутников.
Мы выступали на площадках с разработчиками (Python Meetup, ODS Data Fest) и психологами (CBT FORUM 2025, Открытые Двери.CONF). Наши «агенты» (в смысле человеки) есть как в Москве, так и в Питере. Выступления дают свои плоды: мы запартнерились с проектом «Открытые двери» — платформой доступной психологической помощи. С ними мы делаем бот-тренажер для психологов. Демо-версию мы показали на октябрьской конференции, где получили первый фидбек.
Мы перевели несколько диалоговых датасетов из психодомена с помощью нашего пайплайна перевода. Мы продолжаем над ним работать: учимся находить кривой перевод и учитывать культурные особенности. Кстати, для самих датасетов мы разработали единый формат.
Кроме выступлений мы завели сайт и тг-канал, где ненавязчиво, но регулярно рассказывали о наших насущных делах. У нас даже появилась первая визуальная айдентика.
По научной части мы опубликовали статью про наш датасет, а также два тезиса по пайплайну перевода. Кстати, основную часть работы, как и сами тезисы, сделала студентка. Внезапно, нас нашла другая студентка, пожелавшая свою магистерскую работу посвятить нашей теме с суицидом — будет смотреть, как современные БЯМ справляются с этой темой. Так что мы не только научная, но и образовательная команда.
Кстати, если вдруг вы студент, который ищет тему для курсача или диплома, или вы просто хотите что-то поделать для команды, у нас есть для вас кое-что. Нам очень хочется научиться делить сложные предложения на русском языке на составные части. По неведомой причине, нормально работающих методов для этой задачи нет. Всё, что нужно сделать, это разметить датасет и обучить/потестить разные модельки. Если интересно, пишите нам на почту psytechlab24@gmail.com.
Теперь о планах на предстоящий год.
Вы, может, думаете, зачем мы столько датасетов перевели? Отвечаем — мы хотим сделать психобенчмарк на русском языке: что модели знают о психологии и терапии и как они умеют в эмпатию. Без метрик мы как в тумане. Да, некоторые датасеты у нас будут переведенные, но это лучше, чем вообще ничего. Тем более, что мы еще докрутим перевод.
Мы также готовим научные статьи по синтетике данных для психодомена. О них мы вкратце рассказывали в прошлом девлоге. Приведем там результаты экспериментов и небольшую математическую модель для анализа качества синтетики.
Еще по айдентике и бренду чуть-чуть. Мы поняли, что о «ПсиТехЛаб» очень спотыкается глаз (и печатать неудобно), поэтому будем везде просто «Пситехлабом», как и весь текущий год. Также надо сделать логотип, а то наша картинка с котом всё-таки больше про настроение.
Есть у нас еще россыпь идей, которые мы прорабатываем и думаем, какую из них взять в первую очередь. Оставайтесь с нами, чтобы узнать о них.