Программируем коллективный разум

Тоби Сегаран

Средства эффективной обработки информации в Интернете еще никогда не были настолько важны и востребованы, как сегодня. Эта книга – первое практическое руководство по программированию интеллектуальных приложений для Web 2.0. Здесь вы найдете все необходимое, чтобы научиться создавать самообучаемые программы, которые способны собирать и анализировать огромные массивы данных, имеющиеся в Сети. Вы научитесь пользоваться алгоритмами машинного обучения, адаптируя их под свои собственные нужды. Чтобы овладеть представленным материалом, от вас не потребуется никаких специальных знаний об анализе данных, машинном обучении или математической статистике. Однако предполагается, что вы имеете достаточный опыт программирования и знакомы с основными концепциями. В каждой главе вы найдете практические примеры и задания, которые помогут вам быстро и легко освоить различные аспекты работы алгоритмов.

Издательство: Символ-Плюс, 2008 г.

ISBN 978-5-93286-119-6, 5-93286-119-3, 0-596-52932-5

Количество страниц: 368.

Содержание книги «Программируем коллективный разум»:

  • 9 Предисловие
  • 10 Введение
  • 18 Благодарности
  • 19 1. Введение в коллективный разум
    • 20 Что такое коллективный разум
    • 22 Что такое машинное обучение
    • 23 Ограничения машинного обучения
    • 23 Примеры из реальной жизни
    • 24 Другие применения обучающих алгоритмов
  • 26 2. Выработка рекомендаций
    • 27 Коллаборативная фильтрация
    • 27 Сбор информации о предпочтениях
    • 29 Отыскание похожих пользователей
    • 35 Рекомендование предметов
    • 37 Подбор предметов
    • 39 Построение рекомендателя ссылок с помощью API сайта del.icio.us
    • 43 Фильтрация по схожести образцов
    • 46 Использование набора данных MovieLens
    • 48 Сравнение методов фильтрации по схожести пользователей и по схожести образцов
    • 49 Упражнения
  • 50 3. Обнаружение групп
    • 51 Обучение с учителем и без него
    • 51 Векторы слов
    • 54 Иерархическая кластеризация
    • 60 Рисование дендрограммы
    • 63 Кластеризация столбцов
    • 64 Кластеризация методом K-средних
    • 67 Кластеры предпочтений
    • 71 Просмотр данных на двумерной плоскости
    • 75 Что еще можно подвергнуть кластеризации
    • 76 Упражнения
  • 77 4. Поиск и ранжирование
    • 77 Что такое поисковая машина
    • 79 Простой паук
    • 82 Построение индекса
    • 86 Запросы
    • 88 Ранжирование по содержимому
    • 93 Использование внешних ссылок на сайт
    • 99 Обучение на основе действий пользователя
    • 109 Упражнения
  • 111 5. Оптимизация
    • 112 Групповые путешествия
    • 113 Представление решений
    • 114 Целевая функция
    • 117 Случайный поиск
    • 118 Алгоритм спуска с горы
    • 120 Алгоритм имитации отжига
    • 123 Генетические алгоритмы
    • 127 Поиск реальных авиарейсов
    • 132 Оптимизация с учетом предпочтений
    • 136 Визуализация сети
    • 142 Другие возможности
    • 142 Упражнения
  • 144 6. Фильтрация документов
    • 145 Фильтрация спама
    • 145 Документы и слова
    • 146 Обучение классификатора
    • 149 Вычисление вероятностей
    • 151 Наивная классификация
    • 155 Метод Фишера
    • 159 Сохранение обученных классификаторов
    • 161 Фильтрация блогов
    • 164 Усовершенствование алгоритма обнаружения признаков
    • 166 Использование службы Akismet
    • 168 Альтернативные методы
    • 168 Упражнения
  • 170 7. Моделирование с помощью деревьев решений
    • 171 Прогнозирование количества регистраций
    • 173 Введение в теорию деревьев решений
    • 174 Обучение дерева
    • 176 Выбор наилучшего разбиения
    • 178 Рекурсивное построение дерева
    • 180 Отображение дерева
    • 183 Классификация новых наблюдений
    • 184 Отсечение ветвей дерева
    • 186 Восполнение отсутствующих данных
    • 188 Числовые результаты
    • 188 Моделирование цен на недвижимость
    • 191 Моделирование степени привлекательности
    • 194 В каких случаях применять деревья решений
    • 196 Упражнения
  • 197 8. Построение ценовых моделей
    • 198 Построение демонстрационного набора данных
    • 199 Алгоритм k-ближайших соседей
    • 203 Взвешенные соседи
    • 207 Перекрестный контроль
    • 209 Гетерогенные переменные
    • 212 Оптимизация масштаба
    • 214 Неравномерные распределения
    • 220 Использование реальных данных – API сайта eBay
    • 227 В каких случаях применять метод k-ближайших соседей
    • 227 Упражнения
  • 229 9. Более сложные способы классификации: ядерные методы и машины опорных векторов
    • 230 Набор данных для подбора пар
    • 231 Затруднения при анализе данных
    • 234 Простая линейная классификация
    • 238 Категориальные свойства
    • 242 Масштабирование данных
    • 243 Идея ядерных методов
    • 247 Метод опорных векторов
    • 249 Библиотека LIBSVM
    • 252 Подбор пар на сайте Facebook
    • 258 Упражнения
  • 259 10. Выделение независимых признаков
    • 260 Массив новостей
    • 264 Прошлые подходы
    • 267 Неотрицательная матричная факторизация
    • 273 Вывод результатов
    • 277 Использование данных о фондовом рынке
    • 282 Упражнения
  • 284 11. Эволюционирующий разум
    • 285 Что такое генетическое программирование
    • 287 Программы как деревья
    • 292 Создание начальной популяции
    • 293 Проверка решения
    • 295 Мутация программ
    • 298 Скрещивание
    • 300 Построение окружающей среды
    • 303 Простая игра
    • 308 Направления развития
    • 311 Упражнения
  • 312 12. Сводка алгоритмов
    • 312 Байесовский классификатор
    • 316 Классификатор на базе деревьев решений
    • 320 Нейронные сети
    • 324 Метод опорных векторов
    • 329 k-ближайшие соседи
    • 333 Кластеризация
    • 336 Многомерное шкалирование
    • 338 Неотрицательная матричная факторизация
    • 341 Оптимизация
  • 344 Приложения
  • 344 А. Дополнительные библиотеки
  • 351 В. Математические формулы
  • 358 Алфавитный указатель

Инструкция как скачать книгу Тоби Сегаран: Программируем коллективный разум в форматах DjVu, PDF, DOC или fb2 совершенно бесплатно.
Программируем коллективный разум
Рейтинг книги:
2 голоса
243

Поиск книг:




При поиске учитываются только слова, длина которых больше 3-х символов.

Статистика: