НАСКОЛЬКО БОЛЬШАЯ BIG DATA /​STEVE LOHR /​DATAISM

datat-ism, datatism, date, дата, дата-изм, датаизм, книги про датаизм, юваль ной харари, большие данные, big data, методы научного познания, научно популярные книги, научно популярные фильмы, космическая музыка


Непосредственно за пределами Мемфиса индустриальная симфония машин и людей перевозит товары туда-сюда, их тщательно организованные движения и опознавательные знаки отслеживаются сканерами штрих-кода и чипами, излучающими радиоволны. Механические рычаги срывают упакованные в пластиковую термоусадочную пленку пакеты с конвейерной ленты, когда вилочные погрузчики переправляют пакеты на грузовики для дальних поездок. Люди из плоти и крови направляют и контролируют поток товаров и управляют вилочными погрузчиками и грузовиками.

McKesson, которая распространяет около трети всех фармацевтических продуктов в Америке, проводит эту обширную демонстрацию эффективности. Его здания занимают площадь, эквивалентную более чем восьми футбольным полям, и образуют центр национальной дистрибьюторской сети McKesson — это чудо логистики, которое отправляет товары в 26 000 точек продаж, от местных аптек до Wal­mart. Основной груз — это наркотики, примерно 240 миллионов таблеток в день. Фармацевтический дистрибьюторский бизнес — это бизнес с высокими объемами и мизерной прибылью. Итак, понятно, что эффективность на протяжении десятилетий была для Маккессона почти религией.

Тем не менее, за последние несколько лет McKesson сделала поразительный шаг вперед, сократив запасы, текущие через свою сеть в любой момент времени, на 1 миллиард долларов. Результатом стало понимание, полученное в результате сбора всех данных о продукте, местонахождении и транспортировке со сканеров и датчиков, а затем анализа этих данных с помощью умного программного обеспечения для выявления потенциальных возможностей экономии времени и сокращения затрат. Взгляд на бизнес с использованием новых технологий стал прорывом, который Дональд Уокер, высокопоставленный руководитель McKesson, называет « превращением невидимого в видимое ».

ЛитРес


DATAISM ИЛИ ДАТАИЗМ

В Атланте я стою возле одной из застекленных комнат в отделении интенсивной терапии на пятом этаже университетской больницы Эмори. Внутри густая чаща электронных устройств, настоящий лес медицинских компьютеров, заполняет комнату : респиратор, аппарат для почек, инфузионные машины, перекачивающие антибиотики и обезболивающие опиаты, а также гаджеты, контролирующие частоту сердечных сокращений, дыхание, артериальное давление, насыщение кислородом и т. д. другие жизненно важные признаки. Почти у каждой машины есть собственный компьютерный монитор, каждый из которых издает электронную какофонию звуковых сигналов и предупреждений. Я насчитал дюжину экранов, больших плоских панелей и меньших, размером со смартфон.

datat-ism, datatism, date, дата, дата-изм, датаизм, книги про датаизм, юваль ной харари, большие данные, big data, методы научного познания, научно популярные книги, научно популярные фильмы, космическая музыка

Glob­al Posi­tion­ing System

Типичное отделение интенсивной терапии на двадцать коек генерирует около 160 000 точек данных в секунду. Согласно исследованию Emory, среди всех этих данных, информированные и отвлеченные ими, врачи и медсестры принимают решения быстро, примерно 100 решений в день на пациента. Или более 9,3 миллиона решений об уходе в течение года в отделении интенсивной терапии. Так что есть много места для ошибки. Ошеломленные люди нуждаются в помощи. И Эмори — один из немногих медицинских исследовательских центров, которые работают над преобразованием интенсивной терапии с использованием данных как в палатах интенсивной терапии для взрослых, так и в отделениях интенсивной терапии новорожденных. Потоки данных от медицинских устройств, контролирующих пациентов, анализируются программным обеспечением, которое обучено обнаруживать сигналы раннего предупреждения об ухудшении состояния пациента.

Переваривание огромных объемов данных и выявление, казалось бы, тонких закономерностей — вот в чем преимущества компьютеров и программных алгоритмов больше, чем у людей. Доктор Тимоти Бухман возглавляет такую​работу в Эмори. Хирург, ученый и опытный пилот, Бухман использует аналогию полета, чтобы объяснить свою цель. Данные GPS (Glob­al Posi­tion­ing Sys­tem) о местоположении самолетов преобразуются в экранные изображения, которые показывают авиадиспетчерам, когда рейс сбивается — « сбивается с траектории », как он выражается, — задолго до того, как самолет потерпит крушение. Бухман хочет, чтобы такая же система раннего предупреждения была для пациентов, чьи показатели жизненно важных функций не соответствуют траектории, до того, как они потерпят крах, с медицинской точки зрения. « Вот куда нас ведут большие данные », — говорит он.

Дэвид Брукс, мой коллега из New York Times, назвал это растущее мышление « data-ism » — термин, который я также использовал, потому что он указывает на широту феномена. 

Эра больших данных приближается к зрелости, выходя далеко за рамки интернет-инкубаторов в Кремниевой долине, таких как Google и Face­book. Все началось в цифровом мире битов и быстро продвигается в физический мир атомов, в мейнстрим. Распределительный центр McKesson и отделение интенсивной терапии Эмори указывают путь — большие данные позволяют экономить деньги и спасать жизни. В самом деле, долгосрочная перспектива технологии заключается в том, что она станет слоем управляемого данными искусственного интеллекта, который будет располагаться как в цифровой, так и в физической сферах. Сегодня мы видим первые шаги к этому видению. Технология больших данных знаменует собой революцию в измерениях, которая обещает стать основой для следующей волны эффективности и инноваций во всей экономике. Но здесь работают не только технологии. Большие данные также являются средством выражения точки зрения или философии о том, как решения будут — и, возможно, должны приниматься — в будущем. Дэвид Брукс, мой коллега из New York Times, назвал это растущее мышление « data-ism » — термин, который я также использовал, потому что он указывает на широту феномена. Инструменты инноваций имеют значение, как мы часто видели в прошлом, не только для экономического роста, но и потому, что они могут изменить то, как мы видим мир и принимаем решения по нему.

Скачать. Книга о дизайне и дизайнерах. Дизайн логотипов, бренд стиль, гайдлайн,типографика. Книга о современном искусстве, художники. Шрифтовой дизай. О русском дизайне. О европейском дизайне.

Связка технологий скрывается под флагом больших данных. Первый — это все старые и новые источники данных : веб-страницы, привычки просмотра, сигналы датчиков, социальные сети, данные GPS о местоположении со смартфонов, геномная информация и видео наблюдения. Объем данных продолжает расти, примерно вдвое каждые два года. Но я бы сказал, что наиболее преувеличенным — и часто наименее важным — аспектом больших данных является « большой ». Подсчет глобальных данных становится своего рода кабинетной игрой для ботаников с оценками и прогнозами, экскурсией в лингвистическую захолусть зеттабайтов, йоттабайтов и бронтобайтов. Цифры и их эквиваленты впечатляют. Девяносто процентов всех данных в истории, по одной оценке, было создано за последние два года. В 2014 году Inter­na­tion­al Data Cor­po­ra­tion оценила вселенную данных в 4,4 зеттабайта, что составляет 4,4 триллиона гигабайт. Этот объем информации, как заявила исследовательская компания, пытаясь представить себе перспективу, заполнит достаточно тонкие планшеты iPad Air, чтобы создать стопку высотой более 157 000 миль, или две трети пути к Луне.

Но не все данные одинаковы или одинаково ценны. Суммарные данные ошеломляющие раздуваются из-за роста производства цифровых изображений и видео. Подумайте обо всех снятых и отправленных фотографиях и видеоклипах друга и семьи на смартфоне. Говорят, что картинка стоит тысячи слов. Тем не менее, в арифметике цифровых измерений это значительно преуменьшает, потому что изображения — это обжорство битов. Текст, напротив, требует немного времени. В байте восемь бит. Буква текста занимает один байт, а стандартное изображение с высоким разрешением измеряется в мегабайтах, миллионах байтов. А видео в своем стремлении к битам затмевает неподвижные изображения. И пока я пишу это, на YouTube каждую минуту загружается сорок восемь часов видео, и скорость, вероятно, будет только увеличиваться.

datat-ism, datatism, date, дата, дата-изм, датаизм, книги про датаизм, юваль ной харари, большие данные, big data, методы научного познания, научно популярные книги, научно популярные фильмы, космическая музыка

Технология больших данных

Большие данные имеют значение, но гораздо меньше, чем думают многие. В океане тоже много воды, но пить ее нельзя. Более насущная проблема — это способность использовать и понимать данные. Истории успеха в этой книге связаны с большим количеством данных, но обычно не в таких объемах, которые впечатлили бы инженеров Google. И хотя достижения в компьютерной обработке, хранении данных и памяти помогают справиться с проблемой данных, самый большой шаг вперед — это программное обеспечение. Важнейший код в значительной степени исходит из постоянно развивающегося набора инструментов искусственного интеллекта, такого как программное обеспечение для машинного обучения.

Данные и интеллектуальные технологии открывают дверь в новые горизонты измерений, как издалека, так и крупным планом. Технология больших данных — это эквивалент телескопа или микроскопа в цифровую эпоху. Оба они позволили увидеть и измерить вещи как никогда раньше — с помощью телескопа это были небеса и новые галактики ; с микроскопом это были загадки жизни вплоть до клеточного уровня.

Подобно тому, как современные телескопы изменили астрономию, а современные микроскопы сделали то же самое для биологии, большие данные обещают то же самое, но в более широком смысле, во всех областях и во всех дисциплинах. Далеко идущие достижения в области технологий являются двигателями экономических изменений. Интернет изменил экономику общения. Затем другие технологии, такие как Интернет, были созданы на основе Интернета, который стал платформой для инноваций и новых предприятий. Точно так же большие данные, хотя и являются молодой технологией, трансформируют экономику открытий, становясь, если хотите, платформой для принятия решений людьми.



Решения всех видов будут все чаще приниматься на основе данных и анализа, а не на опыте и интуиции — больше науки и меньше интуиции.

ИСТОРИЯ ДАТАИЗМА И БОЛЬШИХ ДАННЫХ

На протяжении всей истории технологические изменения бросали вызов традиционным практикам, способам обучения людей и даже способам понимания мира. В 1959 году, на заре современной компьютерной эры, английский химик и писатель К. П. Сноу прочитал в Кембриджском университете лекцию « Две культуры ». В нем Сноу проанализировал различия и заметил увеличивающийся разрыв между двумя лагерями — естественным и гуманитарным. Он предупреждал, что раскол между научными и « литературными интеллектуалами » грозит затормозить экономический и социальный прогресс, если гуманитарии будут игнорировать достижения науки и их значение. Лекция была широко прочитана в Америке, и среди тех, на кого оказали влияние, были два профессора Дартмутского колледжа, Джон Кемени и Томас Курц. Кемени, математик и бывший научный сотрудник Альберта Эйнштейна, впоследствии стал президентом Дартмута. Курц был молодым профессором математики в начале 1960‑х годов, когда он обратился к Кемени с идеей дать почти всем студентам Дартмута возможность познакомиться с программированием на компьютере.

Кемени и Курц видели рост вычислительной техники как важную технологическую силу, которая охватит экономику и общество. Но только четверть студентов Дартмута изучали естественные науки или технику, и эта группа, скорее всего, была заинтересована в вычислениях. Тем не менее, как пояснил Курц, « большинство лиц, принимающих решения в бизнесе и правительстве », как правило, исходили от менее технически подготовленных 75 процентов студентов. Итак, Курц и Кемени разработали простой язык программирования BASIC (универсальный символьный код инструкций для начинающих), предназначенный для доступа не инженеров. В 1964 году они начали обучать студентов Дартмута писать программы на BASIC. А варианты Дартмутского BASIC в конечном итоге будут использоваться миллионами людей для написания программного обеспечения. Билл Гейтс написал урезанный BASIC для работы на первых персональных компьютерах, а Microsoft BASIC стал продуктом-основателем компании. Спустя годы Гейтс с любовью вспоминал о подвиге в написании уменьшенной версии BASIC для работы на примитивных персональных компьютерах середины 1970‑х годов. « Из всего программирования, которое я сделал, — сказал мне Гейтс, — это то, чем я больше всего горжусь ».

datat-ism, datatism, date, дата, дата-изм, датаизм, книги про датаизм, юваль ной харари, большие данные, big data, методы научного познания, научно популярные книги, научно популярные фильмы, космическая музыка

Datatism /​datat-ism

Еще в 1960‑х Кемени и Курц не собирались делать Дартмут тренировочной площадкой для профессиональных программистов. Они хотели дать своим ученикам почувствовать взаимодействие с этими цифровыми машинами и вычислительное мышление, которое включает в себя анализ и логическую организацию данных таким образом, чтобы компьютеры могли помочь в решении проблем. Дартмутские профессора на самом деле не преподавали программирование. Они пытались изменить мнение, побудить своих учеников взглянуть на вещи по-другому. Сегодня, когда люди говорят о необходимости переоснащения образования и обучения для эпохи данных, это часто довольно узкое обсуждение конкретных навыков. Но общая картина связана не столько с мастерством мастера данных, сколько с фундаментальным интересом к данным. Более крупная цель — укрепить мышление, чтобы размышления о данных стали интеллектуальным первым принципом, отправной точкой исследования. Это менталитет, который можно резюмировать вопросом : о чем вам говорят данные ?

Обещание больших данных состоит в том, что история намного богаче и детальнее, чем когда-либо прежде, что внезапно дает возможность видеть больше и быстрее учиться — или, по словам руководителя McKesson, « сделать невидимое видимым ». И улучшение не чуть лучше, а принципиально другое. Я считаю это более глубоким смыслом закона Мура. В техническом смысле закон, сформулированный соучредителем Intel Гордоном Муром в 1965 году, представляет собой наблюдение, что плотность транзисторов в компьютерных микросхемах удваивается примерно каждые два года и что вычислительная мощность увеличивается с такой экспоненциальной скоростью. Но в практическом смысле это также означает, что кажущиеся количественные изменения становятся качественными, открывая двери для новых возможностей и делая новые вещи. В вычислениях вы начинаете с расчета траектории полета артиллерийских снарядов — задача, поставленная ENIAC (Электронный числовой интегратор и компьютер) в 1946 году. А к 2011 году у вас есть Wat­son от IBM, побеждающий лучших людей в игре вопросов и ответов Jeopardy.

Для компьютера это всего лишь единицы и нули цифрового кода. Тем не менее, значительное количественное улучшение производительности с течением времени радикально меняет то, что можно сделать. Квалифицированные физики в мире данных часто сравнивают количественное преобразование в качественное с « фазовым переходом » или изменением состояния, когда газ становится жидкостью или жидкость становится твердым телом. Это удачное описательное сравнение. Но я предпочитаю отсылку к закону Мура, и вот почему. Когда температура опускается ниже тридцати двух градусов по Фаренгейту или нуля градусов по Цельсию, вода замерзает. Это происходит естественно, по закону природы. Закон Мура — это наблюдение о том, что происходило в течение многих лет и что вполне может произойти в будущем. Но это не закон природы. Закон Мура действует столько лет благодаря человеческой изобретательности, стремлению и инвестициям. Ученые, компании и инвесторы сделали это возможным.

То же самое и с большими данными. Это стало технически возможным благодаря множеству улучшений в области вычислений, датчиков и связи. Но неуклонный прогресс в программном и аппаратном обеспечении, а также рост информационности будет происходить благодаря мозгу, энергии и деньгам. Революция больших данных требует как новаторских людей, так и институциональной приверженности. Повествование в этой книге построено вокруг каждого из них — молодого человека и старой компании. Молодой человек — 32-летний Джеффри Хаммербахер, олицетворяющий образ мышления data-ism и чья карьера связана с расширяющимися горизонтами технологий и методов обработки данных. Хаммербахер вырос в Индиане, поступил в Гарвардский университет, а затем некоторое время работал количественным анализатором в инвестиционном банке Уолл-стрит, прежде чем сформировать первую команду так называемых специалистов по данным в Face­book. Он ушел, чтобы стать соучредителем и главным научным сотрудником Cloud­era, стартапа, который занимается разработкой программного обеспечения для специалистов по данным. Затем, начиная с лета 2012 года, он пошел по совершенно иному профессиональному пути. Он присоединился к Медицинской школе Икана на горе Синай в Нью-Йорке, где он возглавляет группу данных, которая изучает генетическую и другую медицинскую информацию в поисках прорывов в моделировании и лечении заболеваний. Он считает, что медицинские исследования — лучшее применение его навыков на сегодняшний день.

DATAISM И БОЛЬШИЕ ДАННЫЕ

На другом полюсе современного мира данных находится IBM, технологический гигант столетней давности, известный своим исследовательским мастерством и своей основной корпоративной клиентурой. Ее клиенты позволяют увидеть прогресс, который создают методы обработки данных, а также проблемы, возникающие в различных отраслях. Сама IBM объединила свои исследования, свою стратегию и инвестиции в бизнес, связанный с большими данными. « Мы делаем ставку на компанию », — сказала мне в интервью исполнительный директор Вирджиния Рометти.



Но для IBM большие данные — это не только возможность, но и угроза. Новое недорогое аппаратное и программное обеспечение, на котором работают многие приложения для работы с большими данными — облачные вычисления и открытый исходный код, — вытеснит некоторые традиционные продукты IBM. Компания должна расширяться на новых рынках данных быстрее, чем увянет ее старый бизнес. Ни одна компания не может сравниться с историей IBM в области данных ; Технология основания компании, которая стала называться IBM, перфокарты, разработанные Германом Холлеритом, победила в подсчете и подведении итогов переписи 1890 года, когда американское население выросло до шестидесяти трех миллионов — большие данные того времени. Сегодня исследователи IBM находятся в авангарде технологий больших данных. Проекты McKesson и Emory, которые будут рассмотрены более подробно позже, являются совместными с учеными IBM. И IBM Wat­son, этот механизм искусственного интеллекта, управляемого данными, больше не просто научный эксперимент, а полноценное бизнес-подразделение в IBM, подкрепленное инвестициями в 1 миллиард долларов, поскольку оно применяет свой ум в медицине. сервис, финансовые услуги и т. д. Технология Wat­son теперь является облачным сервисом, предоставляемым через Интернет из удаленных центров обработки данных, и IBM поощряет разработчиков программного обеспечения писать приложения, которые работают на Wat­son, как если бы это была операционная система будущего.

Новое и старое, индивидуум и институт порой являются конфликтующими силами, но также и взаимодополняющими. Трудно представить, что Ham­mer­bach­er и IBM когда-либо будут комфортно сочетаться друг с другом, но они движутся в одном направлении — и оба являются энтузиастами больших данных.

В этой книге проходит еще одна противоречивая, но дополняющая тема, и она сосредоточена на принятии решений. Большие данные действительно могут быть мощным инструментом, но у него есть свои ограничения. Так много зависит от контекста — что измеряется и как это измеряется. Всегда можно собрать данные и проследить закономерности, но является ли эта закономерность значимой и оцениваете ли вы то, что действительно хотите знать ? Или вы измеряете то, что легче всего измерить, а не то, что является наиболее значимым ? Существует естественное противоречие между императивом измерения и миопией измерения. Две цитаты кратко формулируют проблему. Первый : « Вы не можете управлять тем, что не можете измерить ». В отношении этого, похоже, есть двойные утверждения об атрибуции : либо У. Эдвардс Деминг, статистик и эксперт по контролю качества, либо Питер Друкер, консультант по вопросам управления. Кто сказал это первым, значения не имеет. Это мантра в бизнесе, в которой звучит здравый смысл.

datat-ism, datatism, date, дата, дата-изм, датаизм, книги про датаизм, юваль ной харари, большие данные, big data, методы научного познания, научно популярные книги, научно популярные фильмы, космическая музыка

Вторая цитата не так хорошо известна, но в ней тоже много правды : « Не все, что можно подсчитать, имеет значение, и не все, что имеет значение, можно подсчитать ». Альберту Эйнштейну обычно приписывают это имя, но более сильное заявление о происхождении принадлежит социологу Уильяму Брюсу Кэмерону — хотя, опять же, он сказал, что это первое имеет гораздо меньшее значение, чем то, что в нем говорится. Большие данные представляют собой следующий рубеж в управлении путем измерения. Технологии науки о данных уже здесь, они улучшаются и будут использоваться. И это вообще хорошо. Тем не менее, энтузиазм по поводу принятия решений в отношении больших данных, несомненно, выиграет от здоровой дозы скромности, содержащейся во второй цитате.

Более десяти лет в New York Times я освещал технологические ингредиенты и вопросы, которые теперь носят ярлык « большие данные » — задолго до того, как этот термин вошел в обиход и стал еще одним неизбежным модным словом. И я до сих пор верю. Но эта книга — попытка пойти глубже и шире, исследуя проекты и идеи на этом фронте в рамках более широкой экономики, а также беседуя с отдельными учеными, предпринимателями и руководителями предприятий, которые сталкиваются с технологическими и человеческими проблемами, связанными с данными. изм неизбежно создает. Мои отчеты основывались на убеждении, что если современные технологии обработки данных будут иметь большое экономическое значение, они должны стать мейнстримом ; его нужно использовать почти во всех отраслях. Первые триумфы потребительского Интернета — персонализированный поиск, таргетированная онлайн-реклама, индивидуальные рекомендации по фильмам и т. д. — впечатляют. Но применение этих технологий и методов в огромных отраслях физического мира, таких как медицина, энергетика и сельское хозяйство, является более сложной задачей и, в конечном итоге, более значительным достижением, затрагивающим гораздо большее количество людей. На следующих страницах мы рассмотрим развитие больших данных в экономике в целом. Будем искать тон сущность, стоящая за умением продавать. Куда ведет нас data-ism ? В чем преимущества больших данных и где они спотыкаются ?


Книга уже доступна на Литрес :
“Датаизм : о бесконечности алгоритмов жизни”

Книги по теме :

  1. Sapi­ens. Краткая история человечества, автор : Юваль Ной Харари ;
  2. Homo Deus. Краткая история будущего, автор : Юваль Ной Харари ;
  3. Краткая история почти всего на свете : экскурсия в окружающий мир, автор : Билл Брайсон ;
  4. Краткая история времени. От Большого взрыва до черных дыр, автор : Стивен Хокинг ;
  5. Краткие ответы на большие вопросы, автор : Стивен Хокинг ;
  6. Физика невозможного, автор : Митио Каку ;
  7. Самое грандиозное шоу на Земле : доказательства эволюции, автор : Ричард Докинз.

дата, датаизм, дата-изм, date, datatism, datat-ism, книги про датаизм

В этой части мы постараемся отойти от возможности будущего изменения человека ради процветания филос…

Читать далее
дата, датаизм, дата-изм, date, datatism, datat-ism, книги про датаизм

В современном мире существует множество проблем, которые с каждым днем усложняются…

Читать далее
дата, датаизм, дата-изм, date, datatism, datat-ism, книги про датаизм

Философия датаизма в реальной жизни Датаизм был провозглашен в 1970 г. в ходе дискуссии, развернувше…

Читать далее
ivi.ru [CPS]

Рекомендованные статьи