Книга Миллиардер из Кремниевой долины, страница 89. Автор книги Пол Аллен

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Миллиардер из Кремниевой долины»

Cтраница 89

Цель проекта «Цифровой Аристотель» – научить компьютеры постигать все виды человеческих знаний и уметь ими распоряжаться. Чтобы преуспеть в этом, компьютер должен разумно овладевать знаниями в очень крупных объемах, эффективно их осмысливать и находить правильные ответы.

Наша исследовательская программа – проект Halo – разработана с целью построить системы, которые в дальнейшем позволят создать функционального «Цифрового Аристотеля». Программа стартовала семь лет назад, и первой ее целью стал углубленный школьный курс биологии. Мы выбрали именно эту область знаний, поскольку она достаточно (но не чрезмерно) обширна, имеет разработанную учебную программу с итоговыми контрольными тестами и представлена разнообразными видами знаний. На сегодняшний день мы подробно проанализировали все учебники по биологии, чтобы классифицировать все виды содержащихся в них сведений. Теперь мы работаем над способами кодирования этих сведений – чтобы использовать их в компьютерах проекта Halo, объединив с уже имеющимися базами данных, и придать всему этому форму, которая позволит различным экспертным системам находить правильные ответы на поставленные пользователем вопросы.

Главная проблема этого проекта – его глубокая уязвимость. Многие сложные задачи по компьютерному кодированию знаний и имитации мыслительных процессов успешно решаются в лабораториях, но только в небольших объемах. Когда же объемы возрастают – хотя бы до единственного школьного учебника – система падает. Кроме того, отдельные подходы зачастую несовместимы друг с другом, и современные экспертные системы не могут так же быстро переключаться между различными способами использования накопленных знаний, как это делают люди.

Международная команда проекта Halo добилась значительных успехов в исследованиях. Мы надеемся, что к 2015 году сможем создать систему ИИ, включающую большую часть знаний, необходимых для ответов на вопросы по углубленному школьному курсу биологии. Эта система, которая будет иметь вид планшета или электронной книги (Halo-book), станет важным шагом к созданию «Цифрового Аристотеля». Однако впереди еще множество нерешенных задач и немало научных прорывов. Приведу десять важнейших проблем в сфере обработки знаний, которые представляют наибольший интерес для проекта Halo (я распределил их по трем уровням сложности):

I уровень сложности: перспективные подходы, которым, однако, еще далеко до осуществления

– Человеческий язык крайне сложен и многогранен. Существует множество способов выразить одну и ту же мысль, а одно и то же предложение может иметь массу смыслов. Чтобы машина смогла обработать язык во всей его полноте, она должна «понимать» и должным образом реагировать на великое множество речевых оборотов. Многие перспективные технологии разрабатываются с использованием как автоматизированного, так и неавтоматизированного анализа языка, включая статистические исследования больших объемов данных из Интернета. Точки пересечения человеческого языка и знаний – предмет живого интереса для проекта Halo, который изучает весь спектр лингвистических вопросов.


– Визуально-пространственное обучение и мышление. Поместятся ли 17 чемоданов в багажник обычного легкового автомобиля? А открытый зонт? Может ли реактивный самолет приземлиться на тротуар? Какие сведения представлены в диаграмме? Как раскручивается спираль ДНК? Человек без труда выполняет грубые расчеты, связанные с пространственным мышлением. И хотя вычислительная геометрия, необходимая для навигации, промышленного производства и архитектуры, давно существует на рынке, прогресс в области интуитивной геометрии, которой мы пользуемся каждый день, движется очень медленно. Проект Halo в настоящий момент не делает упора на этой области, но любые новые идеи приветствуются.


– Знания о действиях, причинно-следственных связях и моделировании ситуаций. Если на столе стоит чашка, а в комнату входит человек, его появление никак не скажется на чашке – она будет по-прежнему стоять на столе. Но многое другое изменится в результате этого действия: человек больше не будет стоять снаружи; тело и одежда человека окажутся в комнате; комната уже не будет пустой и так далее. Человек легко моделирует ситуации у себя в голове, как в «прямом» направлении (чтобы предсказать возможный исход событий), так и в «обратном» (чтобы установить возможные причины того, что уже случилось). Для ИИ, однако, это весьма сложная задача, и решить ее не могут уже давно. Мыслительные процессы о действиях, изменениях и причинно-следственных связях невероятно сложны, особенно когда эти действия имеют неопределенные или дополнительные последствия. Лучшие решения этой задачи можно найти в бизнес-планировании, автоматическом планировании и робототехнике, но они сугубо специализированы и плохо применимы в других сферах. Проект Halo добился существенного прогресса в имитации мыслительных процессов о действиях и причинно-следственных связях.


– Обращение с неточными и приблизительными сведениями. Наши знания о многих предметах крайне туманны и приблизительны, однако мы обладаем удивительным даром делать правильные выводы и реагировать соответствующим образом. Например, прослушав прогноз погоды, человек знает, что днем может пойти дождь, и принимает на этот случай ряд мер. Люди читают расплывчатые высказывания («Джон довольно высок ростом»), приблизительные оценки («Геном человека содержит около 23 000 генов») или утвердительные высказывания, подразумевающие ряд исключений («Все птицы умеют летать»), и все равно реагируют на них должным образом, несмотря на очевидные неточности. В определенных сферах эти вопросы уже решаются с помощью классических статистических методов, однако прогресс идет очень медленно. Проект Halo добился значительных успехов в этой сфере, которая по-прежнему остается одним из ключевых направлений нашей деятельности.

II уровень сложности: предварительные и экспериментальные исследования

– Скрытые и подразумеваемые смыслы высказываний. Наш язык полон двусмысленностей и намеренных опущений, которые читатель или слушатель всегда воспринимает правильно. Приведу в пример простое высказывание: «Чайную ложку соли растворить в воде». Что именно нужно растворить – чайную ложку или соль? А может, ложка сделана из соли? Благодаря накопленным знаниям люди мгновенно решают подобные двусмысленные задачи, которые для машин представляют большую сложность. Прочитав предложение «Кислоты могут изменять цвет некоторых красок», мы сразу понимаем, что краски и кислоты вступают в химическую реакцию, хотя прямо об этом не говорится. Чтобы правильно понимать подобные высказывания, наш мозг использует как содержащиеся в тексте, так и фоновые знания. Компьютер никогда не будет полностью понимать наш язык, если не решить эту важнейшую проблему.

– Эволюционирующие знания. Приобретение новых знаний – это не просто их запоминание. Необходимо поместить новые сведения в контекст уже имеющихся, чтобы они могли с ними взаимодействовать. Например, если вам показывают упрощенную схему деления клеток, а потом вы встречаете где-то более сложное описание, ваш мозг без труда объединит две картинки и модифицирует первоначальные знания о предмете. Возможно, то, что сначала воспринималось вами как единое явление, теперь необходимо переосмыслить и увидеть в ином качестве – как два взаимосвязанных явления. Этот процесс сохранения, пересмотра и расширения существующих знаний критичен для таких глобальных систем, как «Цифровой Аристотель». Простые специализированные методики для выполнения этой задачи существуют, но полностью автоматизированное решение появится, вероятно, еще очень нескоро.

Вход
Поиск по сайту
Ищем:
Календарь
Навигация