Views Comments Previous Next Search
Как Microsoft изучает климат и перепридумывает историю — Индустрия на Look At Me

ИндустрияКак Microsoft изучает климат и перепридумывает историю

Приложения, которые облегчают сбор данных учёным и студентам

Сбор достоверных данных для исследований по-прежнему занимает немало времени. Хотя данных много, они раскиданы по интернету хаотично и могут находиться в десятках разных источников — а в систематизированном виде им не всегда можно доверять. Из-за этого подготовка к исследованию может иногда занимать чуть ли не больше времени, чем само исследование. Look At Me поговорил с сотрудниками Microsoft Research, которые рассказали о своих инструментах, облегчающих сбор данных.

 

FetchClimate прогнозирует изменение климата на Земле

↑ Обучающее видео по работе
в FetchClimate

«Мы работаем как учёные: создаём инструменты прежде всего для себя, надеясь, что они пригодятся кому-то ещё», — говорит Дрю Пёрвс, глава Computational Ecology and Environmental Science Group (CEES), подразделения Microsoft Research Cambridge, которое занимается созданием моделей экологических систем. Пёрвс руководит разработкой приложения FetchClimate, которое собирает климатические данные по всему миру и даёт прогнозы по изменению климата вплоть до 2100 года. FetchClimate отображает температуру воздуха и воды, количество осадков, влажность воздуха и почвы и многое другое: достаточно выбрать место на карте, временной промежуток, тип и источники данных. Данные выводятся в веб-интерфейсе или по запросу стороннего приложения через API.

Лаборатория в кембриджском подразделении Microsoft Research, куда входит группа Пёрвса, появилась около 10 лет назад. Её основал Стивен Эммотт, специалист по вычислительной математике и биоинформатике. Эммотт считал, что на стыке этих дисциплин появится важнейшее направление для ближайшего будущего. «Чтобы убедить руководство Microsoft, Стивену пришлось провести презентацию для Билла Гейтса и его советников, — рассказывает Пёрвс. — Билл Гейтс всегда говорит на этих встречах то, что думает. На презентации Эммотта он не выбирал выражения: ему показалось, что идея безумна, так как экологи не захотят работать в Microsoft. Но в итоге он всё равно сказал: „Я думаю, что вы, конечно, ошибаетесь, но вы попробуйте”».

За почти 10 лет у Microsoft Research накопился внушительный инструментарий, который бы помог бизнесу и государствам принимать взвешенные решения. Но пока Microsoft только начала искать первых клиентов: «Мы не занимаемся лоббированием чьих-то интересов, мы нейтральны. Для нас главное, чтобы прогностическая модель была прозрачной. Это обычно называют «защитным моделированием»: нужно уметь доказать, что модель прозрачна и на самом деле работает. Это ценно хотя бы с юридической точки зрения: сейчас на учёных иногда подают в суд, если они делают прогнозы, которые оказываются ошибочными и наносят вред».

Как Microsoft изучает климат и перепридумывает историю. Изображение № 2.

 Программную часть FetchClimate разработала исследовательская группа «Информационных технологий в научных исследованиях» на факультете вычислительной математики и кибернетики МГУ

Пёрвс признаёт, что FetchClimate не всегда даёт точные прогнозы. «Один из ключевых параметров любой прогностической модели — уровень неопределённости. Когда мы создаём несколько моделей и видим, что есть одна, которая работает чуть лучше других, от оставшихся мы не отказываемся: они могут давать более точные прогнозы по другим показателям». Пёрвс рассказывает, что иногда, сколько бы они ни вводили в систему данных, разброс прогнозов оказывается слишком широким: «Есть заблуждение, связанное с большими данными, будто их можно просто скармливать компьютеру, и он что-нибудь с ними да сделает. Иногда доходит до смешного: мы используем замысловатые модели, загружаем в них огромное количество данных, а на выходе приходится говорить что-то в духе „если честно, то мы не знаем“. Но есть и многие прогнозы, за которые мы готовы отвечать».

По словам Пёрвса, одна из главных трудностей экологического прогнозирования — это дисбаланс входных данных. «Например, благодаря спутниковой съёмке у нас есть много данных по листовому покрову на Земле, но где-то может не хватать данных по влажности грунта. Искать эти данные непросто, поэтому я очень надеюсь на интернет вещей. Автономные устройства становятся настолько дешёвыми, что мы сможем расставить камеры, ловушки и датчики в дикой местности по всему миру. Также я надеюсь на успехи в распознавании и категоризации изображений, чем занимаются в Wolfram и Microsoft Research». Конечной целью Пёрвс видит «экономику API», где данные не привязаны к конкретной среде и свободно переходят от одного приложения к другому — это значительно облегчило бы работу учёных.

 

ChronoZoom собирает универсальную историю Вселенной

 Как и FetchClimate, ChronoZoom использует мощности облачного сервиса Microsoft Azure. Исходный код приложения также находится в открытом доступе

Приложение ChronoZoom связывает друг с другом все научные направления, от космологии до истории цивилизации. Его основа — это таймлайны с событиями из разных отраслей. При этом в систему можно добавлять данные любого формата, будь это текст, изображения, звук, видео или PDF-файлы. В отличие от FetchClimate, который ориентирован прежде всего на специалистов, ChronoZoom — в первую очередь образовательный инструмент, рассчитанный на преподавателей, школьников и студентов.

За разработку ChronoZoom отвечала исследовательская группа «Информационных технологий в научных исследованиях» МГУ под руководством профессора Сергея Березина. Березин отмечает, что было действительно трудно сделать так, чтобы все сторонние компоненты (например, видео с YouTube и Vimeo) удачно вписались в интерфейс. «Технологии стандартизированы далеко не так хорошо, как хотелось бы, — объясняет он. — Лицензия Apache 2.0 помогла нам использовать много открытого исходного кода. Были и трудности с интерфейсом: правого клика и всплывающих подсказок, которые часто используют на настольных системах, на планшетах нет».

Противоречие, заложенное в само понятие универсальной истории — это то, что однозначные трактовки событий и явлений в научном сообществе бывают редко. «Мы решили эту проблему так, — рассказывает Березин, — каждый пользователь может создавать свои таймлайны и размещать на них то, что считает нужным. Но есть и курируемые таймлайны, которые создают сотрудники Microsoft Research и Калифорнийского университета в Беркли. Их таймлайны соответствуют общепринятым трактовкам».

Как Microsoft изучает климат и перепридумывает историю. Изображение № 3.

 Специальной версии ChronoZoom для смартфонов нет: как говорит Березин, такой задачи не ставили из-за того, что у них не у всех есть достаточно большие экраны

Как утверждает Березин, система устойчива к потенциальным открытиям, которые могут случиться в будущем: «Скажем, шутки ради, выяснится наличие параллельных вселенных. Тогда ничто не помешает отобразить их с помощью нескольких холстов — это будет выглядеть примерно как переключение приложений в Windows 8. Если же говорить серьёзно, то для нас сейчас есть два ключевых направления разработки. Первое — это автоматическое наполнение из других источников. Сейчас у нас есть тысячи экспонатов — это много, но не миллионы, которые есть в стандартизированных базах данных, откуда всё это можно было бы извлечь. Второе — это визуализация данных. Мне это интересно в первую очередь потому, что я сам начинал свою деятельность с компьютерной графики. Нам предстоит решить, как выстроить на экране миллионы точек, чтобы из этого сложилась чёткая новая картина, способная привести к новому открытию или неожиданному взгляду на события прошлого».

Многих озадачивает, что один из главных источников информации в современном интернете — это «Википедия», обладающая своеобразной монополией на знания. Березин опасения коллег разделяет: «Я согласен с достаточно радикальным мнением некоторых профессоров МГУ, что если в дипломной работе встречается ссылка на „Википедию“, то такую дипломную работу защищать нельзя: по ссылке сейчас написано одно, а через месяц будет написано другое. „Википедия“ — очень хороший ресурс, я сам на неё иду как на первый источник информации, но если мне нужна информация с гарантией происхождения (providence), тогда я обращаюсь к другим базам данных — например, научных публикаций, где всё сделано немного по-другому». В каком-то смысле ChronoZoom может быть попыткой предложить модели «Википедии» альтернативу, позволив высказывать несколько точек зрения на одно и то же событие. Но, как отмечает Дрю Пёрвс, сейчас ключевая задача для компании — это продвижение этих инструментов. Он признаёт, что им и его коллегам стоит рассказывать о них больше — иначе потенциальные пользователи так о них и не узнают.

Рассказать друзьям
1 комментарийпожаловаться

Комментарии

Подписаться
Комментарии загружаются