Ulanov csc-nlp-2

67 %
33 %
Information about Ulanov csc-nlp-2

Published on February 26, 2014

Author: compscicenter

Source: slideshare.net

Обработка текстов на естественном языке Александр Уланов Лекция 2. Статистики, языковые модели © Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Оглавление курса 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. Введение. Слова, фразы, предложения, наборы текстов Статистики, языковые модели Классификация текстов Практика I Кластеризация текстов Разбор текстов по частям речи. Поиск именных сущностей Извлечение отношений из текстов Практика II Поиск дубликатов в тексте Анализ мнений Введение в статистический машинный перевод Практика III Литература • Chris Manning and Hinrich Schuetze. Foundations of Statistical Natural Language Processing, MIT Press, 1999 • Philipp Koehn. Statistical Machine Translation, Cambridge Univ. Press, 2010 • © Научные статьи по теме (ссылки на слайдах), видеолекции Stanford и Coursera (Manning) Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 2

Оглавление Введение Статистики Поиск терминологии в тексте Языковые модели (введение) 3 © Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Введение Большинство подходов к анализу языка основано на вероятностных моделях Вероятность слов будем вычислять на корпусе как относительную частоту Распределение вероятностей слов удобно апроксимировать известным распределением, чтобы пользоваться его свойствами (типа среднего или дисперсии) Биномиальное распределение • Описывает вероятность увидеть данное слов

Add a comment

Related presentations

Related pages

Машинное обучение 1, осень 2014 ...

Information about Машинное обучение 1, осень 2014: LASSO, случайные DFT проекции.
Read more

Математическая статистика ...

Ulanov csc-nlp-2. Tweet. 25. 02. 2014 0 views ... Ulanov csc-nlp-11. Education. Tweet. 13. 05. 2014 0 views Ulanov csc-nlp-10. Tweet. 03. 06. 2014 0 ...
Read more