ГлавнаяПресс-ЦентрПубликации

Наука о документах

Исследовательское подразделение компании Xerox берет свои истоки в знаменитом Xerox PARC -- созданном 40 лет назад научном центре, откуда вышел графический пользовательский интерфейс, компьютерная мышь и Ethernet. Европейский центр Xerox (Xerox Research Centre Europe, XRCE) -- одно из пяти исследовательских подразделений компании, находящихся в разных странах мира. Расположенный в центре французских Альп, недалеко от Гренобля, центр ведет разностороннюю деятельность по изучению возможностей применения компьютерных технологий при работе с информацией и документами. Вице-президент XRCE Моника Белтраметти рассказывает о деятельности научного центра.

— Каковы основные направления исследований в XRCE?

XRCE специализируется на сервисах – одном из наиболее важных и динамично развивающихся направлений бизнеса компании. Мы изучаем возможности распознавания содержания документа – текстов и изображений, пути оптимизации работы с большими объемами данных. Извлекая информацию из документов, можно автоматизировать работу с заданиями, выполняемыми вручную, и тем самым упростить различные бизнес-процессы наших заказчиков.

Можно выделить два направления нашей работы. Во-первых, это изучение образов с целью определения их содержания путем применения статистических методов и «обучения» машин. Мы «учим» наше программное обеспечение определять объекты изображений и распознавать содержание документов, что в свою очередь дает возможность автоматизировать процесс их категоризации. Во-вторых, интеллектуальный анализ текстов, во время которого мы проводим семантический анализ путем контекстного поиска слов. Таким образом, мы выявляем смысл документа, что позволяет автоматизировать рабочие процессы, зависящие от понимания контента документа.

На результатах подобных исследований базируются решения Smarter Document Management, предлагаемые Xerox для оптимизации работы с документами. Основными их потребителями являются предприятия и организации, которым необходимо автоматизировать ответы на клиентскую корреспонденцию. Например юридические компании, оказывающие услуги по сопровождению судебных дел и, соответственно, генерирующие миллионы документов.

— Как определяются темы исследований, всегда ли они зависят от потребностей бизнеса Xerox или могут инициироваться сотрудниками XRCE?

Все проекты XRCE делятся на три категории. К первой относятся чисто исследовательские инициативы, в рамках которых мы изучаем новые научные области, ищем новые методы, выстраиваем новые алгоритмы. Вторую категорию мы называем инкубацией – на этой стадии проекты, выбранные из первой категории, интегрируются в бизнес Xerox, а их возможности и результаты демонстрируются бизнес-группам компании. И наконец, над проектами третьей категории мы работаем уже в тесном партнерстве с бизнес-группами, которым на определенном этапе и передаем результаты исследований.

Конечно, выбирая темы для исследований первой категории, мы можем себя почти не ограничивать, однако в поиске новых научных направлений мы всегда помним о том, что со временем они должны будут работать на развитие бизнеса Xerox и приносить пользу компании. Так что исследования, как правило, проводятся в тех областях, которые так или иначе имеют отношение к деятельности головной компании.

— Сколько времени обычно проходит от начала исследовательского проекта до выпуска на рынок соответствующего продукта?

Не думаю, что можно говорить о каком-то стандартном временном интервале для исследовательских проектов. В прошлом они могли длиться по 10-15 лет, но сейчас это неприемлемо — сроки сократились, причем не только в центрах Xerox, но и в исследовательских лабораториях других компаний. Сегодня всем необходимо как можно быстрее получить результаты и вывести на рынок инновационные решения. Сейчас у нас в разработке есть проекты продолжительностью пять лет, и этого времени достаточно, чтобы получить убедительные результаты, которые можно передать бизнес-группам Xerox. В рамках одного из таких исследований мы, в частности, не только анализировали тексты, но и искали возможности полуавтоматической генерации новых документов. Поиск решения по переходу от анализа к созданию документов – достаточно амбициозная задача, решение которой потребовало много времени. Для других типов исследований может хватить и года или двух, например если речь идет о категоризации результатов всех прошлых исследований, полученных в той или иной области. Так было при разработке технологий оптимизации энергопотребления принтеров Xerox — у нас уже имелся опыт в этой области, и нашим специалистам оставалось лишь изучить возможности его применения в конкретной области.

— Что происходит с результатами исследований, которые не находят прямого применения в бизнесе?

Возможны два пути. Первый – Xerox выдает лицензию на использование результатов такого исследования другим компаниям и таким образом получает прибыль. Второй вариант – создаются новые компании, внедряющие результаты исследований и зарабатывающие на них.

— Как XRCE строит взаимоотношения с университетами и научным сообществом Европы?

XRCE активно придерживается политики открытых инноваций и сотрудничает с другими институтами, различными отраслевыми организациями и университетами. В частности, центр принимает участие в целом ряде проектов, которые инициируются Евросоюзом каждые пять лет, а также в разработках, финансируемых французским правительством. Кроме того, мы приглашаем на работу ученых из ведущих университетов и научных центров мира, которые принимают участие в наших исследованиях и делятся своим научным опытом. Тем самым мы поддерживаем постоянный научный обмен с академическим сообществом мира. Недавно, к примеру, у нас работал профессор из Института проблем управления РАН, который был занят в исследованиях, связанных с углубленным анализом данных и их оптимизацией, в частности, в проекте применения различных методов управления энергопотреблением принтеров.

Исследовательские центры Xerox активно сотрудничают с университетами по всему миру. В компании есть экспертный комитет, решающий вопросы финансирования исследований, запросы на проведение которых поступают от научных центров компании. В определенной степени мы пытаемся даже повлиять на развитие в университетах перспективных, на наш взгляд, научных областей. Так, мы много работаем с научными сотрудниками вузов, объясняя им, какого рода исследования и в каких областях нам необходимы, а они в свою очередь готовят студентов к участию в них. Один из крупнейших партнеров Xerox — Массачусетский технологический институт. У нас немало партнеров и в Европе, среди них Университет Джозефа Фурье во Франции, Лондонская школа экономики, Университет Ланкастера в Великобритании и др.

— Какие требования предъявляются к тем, кого вы принимаете на работу?

В центре работает около сотни человек из разных стран мира. Мы стремимся поддерживать интернациональную среду, поскольку заинтересованы в получении знаний из различных уголков планеты. Сотрудники XRCE делятся на младший и старший персонал. Младший персонал должен иметь кандидатскую степень (PhD) в соответствующей области знаний или находиться в процессе ее получения. От старшего персонала мы требуем еще наличия развитых коммуникационных навыков и определенной квалификации в области управления проектами.

Кроме того, мы стремимся всегда иметь определенный процент женщин среди наших сотрудников. В среднем в Европе в подобных исследованиях занято порядка 25% женщин. У нас в центре этот показатель несколько выше – 30%. На самом деле очень трудно найти женщин, которые занимаются изучением таких областей, как машинное обучение и статистические методы, но мы все же пытаемся это делать.

— Вы являетесь членом рабочей группы ЕС под названием Women in Science and Technology. Какие цели она преследует?

Задача группы – создать новые возможности для женщин-ученых, определить причины, по которым пока не очень много женщин заняты в сфере науки и технологий, и способствовать изменению ситуации. Женщинам тяжело сделать карьеру как в государственных, так и в частных исследовательских организациях.

— Насколько вы удовлетворены уровнем подготовки выпускников университетов, которые начинают работу в ваших проектах?

В целом научный и технический уровень студентов Европы очень высок, но они зачастую не имеют необходимых коммуникационных навыков: к сожалению, университеты, в особенности европейские, не учат студентов преподносить свои идеи и раскрывать потенциал предлагаемых проектов.

Некоторым нашим сотрудникам не хватает навыков управления проектами, умения организовать не только свою собственную работу, но и работу других. Европейские университеты очень академичны и дают главным образом теоретические знания, которые, безусловно, имеют свои преимущества, но для успешной исследовательской работы необходим определенный уровень навыков и в других областях. Мы часто проводим тренинги для персонала в этих сферах, но для достижения хороших результатов необходимо много практиковаться, что требует больших временных затрат.

www.osp.ru

Все публикации