При поиске ответа Watson сначала разбирает подсказку на составные части, анализирует слова и пытается понять, что именно он должен найти. Этот кажущийся столь простым этап сам по себе представляет задачу колоссальной трудности для компьютера. Рассмотрим, например, подсказку из категории «Блоги Линкольна», которая использовалась при обучении Watson: «Секретарь Чейз только что передал это мне в третий раз. И знаешь что, дружище? На этот раз я это принимаю». Чтобы у машины был хоть какой-то шанс дать правильный ответ, она должна для начала понять, что первое слово «это» в данном примере выступает в качестве заместителя ответа, который она и должна найти.
Как только Watson заканчивает анализ подсказки, он запускает сразу сотни алгоритмов, каждый из которых применяет отличный от остальных подход, пытаясь найти возможный ответ в содержащемся в памяти компьютера массиве справочных материалов. Если вернуться к приведенному выше примеру, то сначала Watson выделяет слово «Линкольн» в названии категории как значимое, а слово «блоги» игнорирует, воспринимая его как фактор отвлечения внимания: в отличие от человека, машина не способна понять, что сценаристы шоу пытались представить Авраама Линкольна блогером.
По мере того как конкурирующие поисковые алгоритмы выдают сотни возможных ответов, Watson начинает их сравнивать и ранжировать по определенным критериям. Один из используемых машиной методов отбора предполагает вставку возможного ответа в исходную подсказку таким образом, чтобы в итоге получилось утверждение; затем машина снова обращается к справочным материалам в поисках подкрепляющих данное утверждение данных. Итак, одному из поисковых алгоритмов удается отыскать правильный ответ — «прошение об отставке». В этом случае Watson может попробовать обнаружить в своем наборе данных что-то вроде следующего утверждения: «Секретарь Чейз только что подал Линкольну прошение об отставке в третий раз». Он найдет большое количество близких совпадений, что увеличит степень уверенности суперкомпьютера в правильности данного конкретного ответа. Кроме того, при оценке возможных ответов Watson обращается к большому объему исторических данных: он точно знает, какие алгоритмы показывают наилучшие результаты при работе с вопросами определенного типа, а также очень внимательно «прислушивается» к тем из них, которые демонстрируют самые высокие показатели. Способность Watson правильно ранжировать сформулированные на естественном языке ответы, а затем определять степень уверенности в правильности ответа и решать, нажимать кнопку в «Jeopardy!» или нет, является одной из определяющих характеристик системы — тем самым качеством, которое ставит его на передний край в мире технологий искусственного интеллекта. Машина IBM «знает, что она знает», т. е. делает что-то такое, что легко дается людям и ускользает практически от всех компьютеров, когда они погружаются в массивы неструктурированной информации, предназначенной для людей, а не для машин.
Watson одержал верх над чемпионами «Jeopardy!» Кеном Дженнигсом и Брэдом Раттером в двух играх, показанных в эфире американского телевидения в феврале 2011 г., обеспечив компании IBM тот всплеск общественного внимания, на который она изначально и рассчитывала. Но еще задолго до того, как шумиха, поднявшаяся в СМИ вокруг этого выдающегося достижения, стала стихать, началась реализация проекта, который имел куда более серьезные последствия: специалисты IBM запустили кампанию по поиску возможностей для применения возможностей Watson в реальном мире. Одной из самых многообещающих областей является медицина. При использовании в качестве инструмента диагностики Watson обеспечивает получение точных ответов на основе анализа громадного количества медицинской информации, включающей учебники, научные журналы, клинические исследования и даже записи врачей и медсестер, относящиеся к конкретным пациентам. Ни один врач не сможет сравниться с Watson по способности погружаться в огромные массивы данных и обнаруживать в них неочевидные взаимосвязи — особенно если информация берется из источников, находящихся на стыке медицинских специальностей. К 2013 г. Watson уже помогал диагностировать заболевания и корректировать планы лечения пациентов в крупных медицинских учреждениях, включая Кливлендскую клинику и Онкологический центр Андерсона при Техасском университете.
В ходе адаптации Watson к выполнению практических задач исследователям IBM пришлось проверить на прочность один из ключевых постулатов революции больших данных: идею о том, что прогнозирования на основе корреляции достаточно и что глубинные причинно-следственные связи, как правило, не поддаются анализу, да и сам такой анализ не нужен. Новые возможности открывает программный комплекс WatsonPaths, позволяя пойти дальше простого поиска ответов на вопросы; показывая исследователям конкретные источники, к которым обращался Watson; логику, которой он руководствовался при оценке, и выводы, которые он сделал в процессе поиска ответа. Другими словами, Watson постепенно приближается к тому, чтобы обеспечивать более глубокое понимание того, почему что-то соответствует истине. WatsonPaths также используется в качестве средства обучения студентов-медиков методам диагностирования. Менее чем через три года после успешного завершения группой людей проекта по созданию и обучению Watson ситуация поменялась — во всяком случае в определенной мере — с точностью до наоборот, и теперь люди учатся у компьютерной системы решать сложные примеры.
Другими очевидными сферами практического применения системы Watson являются обслуживание клиентов и техническая поддержка. В 2013 г. IBM объявила о начале сотрудничества с компанией Fluid, Inc., являющейся крупным поставщиком услуг в области интернет-торговли и консалтинга. Цель проекта — разработать для интернет-магазинов систему помощи клиентам, которая обеспечивала бы индивидуальный подход и умела пользоваться естественным языком так, как это делают опытные продавцы-консультанты в магазинах розничной торговли. Если вы собираетесь в поход и вам нужна палатка, вам достаточно будет просто сказать что-нибудь вроде: «В октябре мы с семьей отправляемся в поход на север штата Нью-Йорк, и мне нужна палатка. Что посоветуете?» В ответ вы получите конкретные рекомендации по выбору палатки, а также информацию о других вещах, которые могут пригодиться в походе и о которых вы могли забыть. Как я уже говорил в первой главе, появление такой возможности в виде приложения для смартфона, с помощью которого покупатели смогут получить рекомендации на естественном языке, подобно тому, как это происходит в традиционных магазинах, — лишь вопрос времени.