Показать меню

Размещение патинко

Размещение патинко (англ. pachinko allocation, PAM) — метод тематического моделирования, применяемый в машинном обучении и обработке естественного языка, позволяющий обнаружить скрытую тематическую структуру в коллекции документов. От более ранних методов (например, LDA) алгоритм отличается тем, что моделирует корреляции между темами в дополнение к корреляциям слов, задающих темы. PAM превосходит LDA по гибкости и выразительной силе. Впервые метод описан, реализован и применён для обработки текстов на естественном языке, однако, может быть использован и в других областях, например, для задач биоинформатики. Своё название получил благодаря популярным в Японии игровым автоматам патинко, в которых реализована игра, напоминающая пинбол на доске Гальтона.

История

Впервые размещение патинко было описано Ли Вэем и Эндрю Маккаллумом в 2005 году. В 2007 году Ли, Маккаллумом и Дэвидом Мимно идея была обобщена до иерархического размещения патинко. В том же году Маккаллум и его коллеги предложили ввести в PAM непараметрическое байесовское распределение, основанное на модификации иерархического процесса Дирихле (HDP). Алгоритм реализован в Java-библиотеке с открытым исходным кодом Mallet.

Модель

Для изображения порождающей модели строится ациклический орграф, в котором вершинами являются слова и темы, причём слова могут быть только листьями. Тогда «трёхуровневая» модель — это LDA, а «двухуровневая» модель — Дирихле-мультиномиальное распределение[уточнить].

Еще по этой теме:
Метод Виолы — Джонса
Метод Виолы — Джонса
Метод Виолы — Джонса (англ. Viola–Jones object detection) — алгоритм, позволяющий обнаруживать объекты на изображениях в реальном времени. Его предложили Паул Виола и Майкл Джонс в 2001 году. Хотя
Эволюционно-симулятивный метод
Эволюционно-симулятивный метод
Эволюционно-симулятивный метод (ЭСМ) — метод моделирования равновесных случайных процессов и принятия решений в условиях неопределенности. ЭСМ успешно применяется в экономике и физике. Общие
Функционально-параметрический регрессионный метод (часть 2)
Функционально-параметрический регрессионный метод (часть 2)
Существует также два способа оценки параметров математических уравнений с помощью ПТФ: 1. Представление обобщенных параметров гидрофизических характеристик, группируя по какому-либо почвенному
Деревья решений (часть 1)
Деревья решений (часть 1)
Деревья решений (или деревья принятия решений) являются одним из наиболее популярных подходов к решению задач Data Mining, направленных на раскрытие структуры данных. Этот метод может быть применен
Предварительный этап работ, планирование эксперимента (часть 3)
Предварительный этап работ, планирование эксперимента (часть 3)
Следует отметить, что описанные подходы вовсе не обязательно должны быть противопоставлены друг другу. Возможны ситуации, при которых разумным будет являться комбинированное использование этих
Метод обратных взвешенных расстояний и радиальных базисных функций
Метод обратных взвешенных расстояний и радиальных базисных функций
Примером детерминистских методов является также метод обратных взвешенных расстояний (IDW). Метод не позволяет выявить структуру варьирования признака, но может служить для точной интерполяции. В
Комментарии:
Добавить комментарий
Ваше Имя:
Ваш E-Mail: