Визуализация семантических связей между словами

Введите cлова через запятую. Мы построим карту их взаимного расположения в выбранной модели/моделях и отобразим двумерную проекцию этой карты (из векторного пространства высокой размерности).

(+)
Вы можете добавлять новые группы слов кнопкой ’+’; они отобразятся на визуализации разными цветами (если группа одна, цвета соответствуют частям речи). Оптимальное общее количество слов — от 7 до 20.

Выберите модель:

Примеры больших семантических карт*

5 тысяч наиболее частотных знаменательных слов в НКРЯ

Визуализация отношений между cуществительными; по клику доступна полноразмерная версия

Тысяча наиболее частотных существительных в корпусе НКРЯ+Википедия

Визуализация отношений между cуществительными; по клику доступна полноразмерная версия

* t-SNE — это алгоритм снижения размерности и визуализации высокоразмерных данных. Он разработан Лоренсом ван дер Маатеном и описан в этой статье:

L.J.P. van der Maaten and G.E. Hinton. Visualizing High-Dimensional Data Using t-SNE. Journal of Machine Learning Research 9(Nov):2579-2605, 2008


Слова, выделенные зеленым, являются высокочастотными (доля слова в корпусе выше 0.00001); слова, выделенные красным, являются низкочастотными (доля слова в корпусе ниже 0.0000005).

Команда RusVectōrēs

Университет Осло Национальный Исследовательский Университет Высшая Школа Экономики

Лицензия Creative Commons