Узнайте о продуктах и решениях InterSystems, возможностях карьерного роста и многом другом. Результаты включают в себя контент из нашего сообщества разработчиков, документацию по продуктам и образовательные веб-сайты в дополнение к InterSystems.com.
InterSystems IntegratedML

Машинное обучение - это просто

0:00 / 0:00
Video Companion

Выиграйте войну за таланты в области искусственного интеллекта с помощью простого в разработке и развертывании решения для машинного обучения

По данным Forrester Research, "98% компаний испытывают трудности с получением ценной информации из собираемых ими данных. Это связано, прежде всего, с отсутствием внутренней экспертизы".1 Хотя сегодня ваша организация может сохранять конкурентные преимущества без этой информации, темпы изменений в направлении цифровой трансформации могут вскоре повлиять на ваш бизнес.

Поэтому повсеместно организации сосредоточены на использовании данных - и внедрении искусственного интеллекта (ИИ) и машинного обучения (ML) - для улучшения своего бизнеса. С помощью машинного обучения (ML) вы можете улучшить и автоматизировать бизнес-операции, прогнозировать события и поведение, а также проактивно выполнять предписывающие программные действия на основе этих прогнозов.

Например, используя ML и предиктивную аналитику, ваша организация может выявить и таргетировать новых покупателей или определить лучшее время для проведения распродажи, лучше понимая поведение и предпочтения потребителей. Если вы являетесь поставщиком медицинских услуг, ваша организация может проанализировать закодированные диагнозы, а также данные о приеме, переводе и выписке пациента, чтобы снизить показатели повторной госпитализации. Проще говоря, ML может сэкономить время и ресурсы, улучшить прогнозирование, позволить вам принимать лучшие решения и достигать лучших результатов.Звучит здорово, но есть один недостаток: разработка моделей ML сложна и требует дефицитной и дорогой экспертизы.К счастью, эксперты отрасли работают над тем, чтобы сделать ML проще в использовании, разрабатывая новые инструменты, включая AutoML и IntegratedML

®.

Краткое описание технологии IntegratedML

Прочитав этот краткий обзор технологии, вы узнаете:

  • Почему ML имеет решающее значение для успеха вашего бизнеса
  • Как нехватка талантов мешает организациям использовать возможности машинного обучения
  • Что такое AutoML и как он поможет вам выиграть войну за таланты в области ИИ
  • Что такое InterSystems IntegratedML® и для чего он предназначен:
    • Расширить возможности ваших разработчиков программного обеспечения для создания моделей ML и приложений с поддержкой ML.
    • Повысить производительность труда обученных специалистов по обработке данных.
    • Оптимизировать операционные и аналитические процессы для повышения качества обслуживания клиентов, повышения эффективности работы и производительности.
    • Повысить точность прогнозов, получить лучшие бизнес-результаты и обеспечить отличие от конкурентов.

Этот технологический обзор будет интересен для чтения руководителям, менеджерам и ИТ-специалистам, независимо от того, хотите ли вы повысить производительность своей команды машинного обучения (ML) или только начинаете работать с ML без необходимости нанимать экспертов по машинному обучению.

Скачать технологический обзор

Машинное обучение: значение

Как приложение ИИ, машинное обучение тренирует машину узнавать данные на основе опыта и умозаключений. Оно постоянно улучшает результаты, не будучи специально запрограммированным на это.

ML может анализировать широкий спектр данных и создавать модели, используемые для удовлетворения огромного количества аналитических и операционных требований. В автономном режиме ML-модели могут помочь бизнес-пользователям понять поведение клиентов или проблемы эффективности процессов, и это лишь несколько применений. При внедрении в Интернете или в операционных процессах бизнеса машинное обучение может заметно улучшить результаты - будь то рекомендация предпочтительного продукта или услуги клиенту во время просмотра сайта, проактивное предупреждение перед совершением продажи, если существует высокий риск того, что поставщик не сможет ее осуществить, или определение возможного мошенничества перед одобрением транзакции. Отделы в каждой части вашей организации могут извлечь выгоду из машинного обучения, включая продажи и маркетинг, исследования и разработки, юридический отдел, отдел кадров, службу поддержки клиентов, разработку продукции и даже финансы. Факт в том, что ML приносит пользу практически в каждой отрасли и обещает стать повсеместным по мере того, как все больше организаций будут его использовать.

Вы уже сталкиваетесь с машинным обучением в своей повседневной жизни: от виртуальных персональных помощников, таких как Amazon Alexa и Siri от Apple, до фильтров спама и детекторов вредоносных программ, до метода Facebook, предлагающего новых друзей и новые группы, до чат-ботов, обеспечивающих онлайн-поддержку клиентов, до умных автомобилей, которые сами управляют собой.

Машинное обучение: Препятствия

Машинное обучение дает множество преимуществ, но возникает вопрос: почему не все компании используют его? Одна из основных причин: ML сложен в использовании и требует высокого уровня знаний.

ML требует экспертов, понимающих теорию, технологию, методы и инструменты. Сегодня таких специалистов немного, и они пользуются большим спросом. Согласно последним данным Бюро статистики труда США, в США насчитывается менее 32 000 специалистов по работе с данными.2 Усугубляет нехватку специалистов по ИИ и специалистов по работе с данными то, что большая часть имеющихся специалистов нанимается такими цифровыми гигантами, как Amazon, Facebook, Google и Microsoft, которые платят головокружительно высокие зарплаты. Это затрудняет для организаций конкурентную борьбу за эти и без того ограниченные ресурсы.

AutoML: победа в войне за таланты в области ИИ

Автоматизированное машинное обучение (AutoML) - это бурно развивающаяся новая технология для организаций, желающих расширить сферу применения своих нынешних талантов в области машинного обучения, а также для тех, кто только начинает свой путь в ML.

AutoML является относительно новым подходом к науке о данных - он автоматизирует и упрощает создание ML-моделей. Он выполняет инженерию характеристик, автоматизируя процесс преобразования необработанных данных в форматы, подходящие для ML-моделей. Он автоматизирует выбор модели, обучение и анализ результатов - и тестирует различные алгоритмы ML с различными параметрами для создания наиболее точной модели для любой конкретной проблемы. Для организаций, имеющих команду специалистов по анализу данных, это автоматизирует большую часть ручных процессов и процессов проб и ошибок, используемых для построения ML-моделей, и значительно повышает производительность труда специалистов по анализу данных, экономя их время и усилия.

Если у вас в штате еще нет специалистов по машинному обучению, инженерия функционала, создание и обучение моделей может оказаться сложной задачей. Но теперь, благодаря AutoML, вашей организации не обязательно нужны специалисты по анализу данных для создания полезных моделей ML. Вместо этого вы можете начать с простых сценариев использования и AutoML, одновременно обучая своих разработчиков более глубокому анализу и процессу разработки ML.

Однако многие инструменты AutoML сегодня ограничены. Хотя они способны создавать модели машинного обучения, они не предоставляют функциональности для запуска моделей внутри бизнес-процессов в реальном времени. Это та важная особенность, которая отличает InterSystems IntegratedML.

InterSystems IntegratedML: AutoML на высшем уровне

InterSystems IntegratedML является встроенной функцией платформы данных InterSystems IRIS® - полной программной среды управления данными. IntegratedML предоставляет все возможности и преимущества традиционного AutoML. Однако, поскольку он встроен в InterSystems IRIS, вы можете разрабатывать и внедрять сложные приложения, которые легко выполняют эти модели динамически в ответ на события и транзакции в реальном времени, без извлечения или перемещения каких-либо моделей или данных.

Например, рассмотрим банк, выпускающий кредитные карты, которому необходимо определить риск мошенничества перед утверждением каждой транзакции. Он выполняет высокопроизводительное приложение для кредитных карт в режиме реального времени, разработанное с помощью InterSystems IRIS, которое хранит все демографические и финансовые данные всех клиентов и транзакций по кредитным картам. Это приложение может содержать сотни элементов данных по каждой операции с кредитной картой - в том числе о том, была ли каждая операция мошеннической или действительной.

Используя IntegratedML, существующие разработчики приложений в банке могут автоматически создать модель машинного обучения для выявления транзакций с высоким риском на основе прошлых транзакций, просто выбрав нужное поле (например, "is_fraudulent") и позволив IntegratedML создать наиболее подходящую модель и параметры.

Но в отличие от традиционного AutoML, модель на основе InterSystems IntegratedML может быть легко включена в приложение для кредитных карт для выполнения в режиме реального времени при каждой входящей транзакции, и приложение может предпринять соответствующие программные действия, если модель определит
, что существует высокий риск мошенничества, например, предотвратить транзакцию, позвонить или отправить СМС владельцу карты.

IntegratedML также облегчает поддержание моделей в актуальном состоянии по мере работы приложений в производстве и получения новых данных. В случае с мошенничеством с кредитными картами, поскольку один способ мошенничества обнаруживается и предотвращается приложением, преступники наверняка начнут применять новые методы. Поскольку все данные, включая самые последние, хранятся в платформе данных, нет необходимости создавать ручные извлечения и перемещать данные в различные среды. Вместо этого банк может постоянно совершенствовать модели, используя самые последние данные, чтобы без промедления обнаруживать и предотвращать новые модели атак.

С помощью InterSystems IRIS и IntegratedML вы можете разрабатывать приложения, выполняющие интеллектуальные предписывающие программные действия в ответ на события в реальном времени, и получать важнейшие конкурентные преимущества и выгоду для бизнеса. Это поможет вам первыми вывести на рынок новый продукт или услугу, первыми приступить к реализации новой инициативы и первыми отреагировать на изменение поведения клиентов.

IntegratedML: экономия времени специалистов и повышение производительности труда

С помощью IntegratedML разработчик, не имеющий практически никаких знаний в области ML, может использовать SQL для разработки сложных ML-моделей.

Это не означает, что вы никогда не должны нанимать специалистов по анализу данных. Если ваша организация является крупным предприятием с командой специалистов по работе с данными, IntegratedML может значительно сэкономить время ваших инженеров по работе с данными и специалистов по работе с данными. Например, исследование 2018 года, проведенное Kaggle ML and Data Science3 , показало, что специалисты по работе с данными тратят почти 40% своего времени на сбор и очистку данных4 (см. рисунок 1 ниже). Использование IntegratedML для подготовки данных и разработки функционала позволяет высвободить специалистов по анализу данных, чтобы они могли сосредоточиться на более важных и дорогостоящих задачах, таких как оптимизация моделей.

Для организаций, только начинающих осваивать машинное обучение, InterSystems IntegratedML позволяет разработчикам программного обеспечения и аналитикам, которые создают ваши бизнес-приложения и знакомы с данными, самостоятельно изучать машинное обучение. IntegratedML автоматизирует основную работу, такую как определение наиболее подходящих моделей, установка параметров, построение и обучение моделей. Это также ускоряет процесс интеграции моделей машинного обучения в производственные приложения. По мере того, как ваши разработчики становятся более искушенными и начинают понимать процесс и результаты, они могут начать изменять необязательные параметры и самостоятельно устанавливать значения. Специалисты по анализу данных также могут быть более продуктивными с помощью IntegratedML, поскольку они могут тратить свое время на фактическую оптимизацию модели, а не на обработку данных, разработку и выбор функций.

developer reviewing code on laptop

InterSystems Integrated ML: как это работает

С помощью IntegratedML обучение модели, включая определение соответствующих входных характеристик из исходных данных, настройку параметров модели и выполнение, осуществляется с помощью всего нескольких команд SQL.

CREATE MODEL WillSurvive PREDICTING (Survived) FROM Titanic

Команда CREATE MODEL устанавливает метаданные модели машинного обучения. Разработчики указывают название модели (WillSurvive), целевое поле для прогнозирования (Survived) и набор данных для получения целевого поля и всех входных полей модели (Titanic). Синтаксис FROM является полностью общим и может задавать любое выражение подзапроса. Метаданные, связанные с этим набором данных, также используются для вывода типов данных целевых и входных полей, полностью определяя проблему для решения модели.

TRAIN MODEL WillSurvive FROM Titanic

Команда TRAIN MODEL определяет данные, которые будут использоваться для обучения, и запускает механизм AutoML, который принимает на вход набор реляционных данных. Поскольку синтаксис FROM является общим, одна и та же модель может быть обучена несколько раз на разных наборах данных. Например, вы можете захотеть обучить модель маркетинговой кампании на разных сегментах клиентов или регулярно переобучать модель по мере поступления новых обучающих данных.

Механизм AutoML автоматически берет на себя решение всех необходимых задач машинного обучения. Он определяет релевантные признаки-кандидаты из выбранных данных, рассматривает применимые типы моделей на основе данных и постановки задачи и настраивает гиперпараметры для получения одной или нескольких запускаемых моделей.

Разработчики могут выбирать из различных движков AutoML, включая InterSystems AutoML, H2O и DataRobot Enterprise AI Platform. Все опции движка AutoML легко интегрируются в InterSystems IRIS и прозрачны для разработчиков.

SELECT PREDICT(WillSurvive) As Predicted FROM Titanic
SELECT PROBABILITY(WillSurvive FOR 1) FROM Titanic

После обучения модель выдает результаты через одну из двух скалярных функций, PREDICT() и PROBABILITY(). PREDICT() возвращает наиболее вероятное или расчетное значение для указанного столбца, определенное обученной моделью. Для задач категоризации функция PROBABILITY() возвращает рассчитанную вероятность того, что целевое поле модели будет равно заданному пользователем значению. Эти простые скалярные функции можно использовать в любом месте запроса и в любой комбинации с другими полями и функциями. Одним из ключевых новшеств IntegratedML является прозрачное отображение доступных полей в заданном контексте запроса на поля ввода, необходимые для выполнения модели.

IntegratedML обеспечивает дополнительную гибкость для разработчиков, например, для отображения на другие источники данных, помимо конкретной таблицы или запроса, используемого для создания или обучения модели, как показано на следующем примере.

SELECT Name, PREDICT(WillSurvive WITH Sex = Geschlecht, Age = DATEDIFF(year, NOW(), Geburtsdatum), Fare = TicketPreise, Cabin = Kabine) FROM Hindenburg

В то время как большинство решений AutoML работают в автономной среде с низкопроизводительным соединением с внешними платформами данных и приложениями, IntegratedML отличается. Он работает в рамках платформы данных InterSystems IRIS, ускоряя и упрощая обучение и выполнение ML-моделей, и позволяет легко интегрировать ML-модели в приложения InterSystems IRIS без перемещения данных и моделей. Такая операционализация моделей ML считается одним из самых больших препятствий для быстрого внедрения ML в бизнес-приложения.

Платформа данных InterSystems IRIS

Технология InterSystems используется в 150 000 внедрений по всему миру в различных отраслях промышленности. InterSystems IRIS Data Platform - это полная программная платформа управления данными, созданная для ускорения и упрощения разработки приложений в режиме реального времени. InterSystems IRIS позволяет разработчикам внедрять сложную аналитику, включая бизнес-аналитику, искусственный интеллект, ML, обработку естественного языка и предиктивную аналитику, в критически важные бизнес-процессы в режиме реального времени. Встроенный высокопроизводительный механизм транзакционно-аналитической базы данных одновременно поддерживает операционные и аналитические рабочие нагрузки в очень больших масштабах.

Помимо встроенных возможностей разработки и выполнения ML, InterSystems IRIS также обеспечивает:

Интеграцию данных и приложений - InterSystems IRIS предоставляет полный набор возможностей интеграции и взаимодействия для очистки, преобразования и нормализации данных, а также поддержки сложных интеграций. Решение обеспечивает готовые возможности подключения и преобразования данных для широкого спектра пакетных приложений, баз данных, отраслевых стандартов, протоколов и технологий, облегчая интеграцию и анализ данных и построение прогнозирующих и предписывающих моделей.

Кроме того, вы можете встроить аналитическую обработку, такую как SQL-запросы, предиктивная аналитика, ML и обработка естественного языка (NLP) в составные бизнес-процессы, которые соединяют разрозненные источники данных и приложения. Эти составные процессы могут оптимизировать операции, запускать оповещения и делать это без влияния на производительность приложения.

Масштабируемость - InterSystems IRIS вертикально и горизонтально масштабируется и обладает высокой эффективностью использования ресурсов, что делает его идеальным для приложений, поддерживающих очень большой объем поступающих данных, высокий уровень аналитических нагрузок, множество параллельных бизнес-процессов и возможность обработки, хранения и анализа очень больших массивов данных экономически эффективным способом.

Отчетность и прослеживаемость - Все данные (включая данные в полете, метаданные и данные, связанные с длительными асинхронными транзакциями) автоматически сохраняются во встроенной базе данных и доступны для отчетности и анализа в режиме реального времени. Визуализация и диагностика поведения интеграций и процессов упрощается благодаря возможности визуальной трассировки.

Графическую разработку - графические инструменты с низким кодом позволяют разработчикам визуально отображать процессы, преобразования, правила и рабочие процессы, чтобы они могли сосредоточиться на логическом взаимодействии между системами, а не на кодировании. Графические модели способствуют сотрудничеству между подразделениями бизнеса и ИТ, позволяя вашей организации быстрее разрабатывать новые решения или модифицировать существующие приложения.

Развертывание - InterSystems IRIS поддерживает широкий спектр вариантов развертывания, включая все основные публичные облака, частные облака, помещения и гибридные варианты развертывания.

Если вы хотите радовать своих клиентов персонализированным опытом в режиме реального времени, улучшать клинические результаты для пациентов, проактивно предсказывать необходимость технического обслуживания до возникновения отказов или выявлять и предотвращать мошенничество в режиме реального времени, InterSystems IRIS и IntegratedML помогут вам достичь этих и других целей.

Подробнее о InterSystems IRIS

Заключение

Машинное обучение - это волна будущего, и любая организация, стремящаяся конкурировать, должна начать его использовать. К сожалению, специалистов по анализу данных не хватает, а их зарплаты стремительно растут, поэтому крупным организациям сложно расширить сферу применения ML, а небольшим организациям - начать работу с ML. Хотя такие инновации, как AutoML, помогают, одного AutoML недостаточно.

InterSystems IntegratedML предоставляет сложные возможности AutoML, открытые через интуитивно понятный SQL-интерфейс и полностью интегрированные в комплексную платформу данных. IntegratedML позволяет легко внедрять модели машинного обучения в критически важные приложения в режиме реального времени без необходимости перемещения данных или моделей, а также без привлечения штата специалистов по анализу данных. Вместе InterSystems IRIS и IntegratedML позволяют вам создать эффективный цикл совершенствования, постоянно совершенствуя модели ML без задержек в ответ на самые последние производственные данные.

Если у вас есть команда специалистов по анализу данных, IntegratedML повысит производительность вашей команды.

Если вы только начинаете свой путь в области ИИ, IntegratedML поможет вам начать работу с машинным обучением уже сейчас, не нанимая дорогостоящих экспертов по ML.

В любом случае, IntegratedML может вам помочь:

  • Ускорить и упростить создание ML-моделей
  • Выполнять интеллектуальные программные действия в режиме реального времени
  • Оптимизировать процессы для улучшения обслуживания клиентов, повышения эффективности работы и производительности
  • Повысить точность прогнозов, ускорить достижение лучших результатов и опередить конкурентов
  • Разрабатывать более интеллектуальные приложения быстрее и проще с меньшим количеством ресурсов
  • Победить в войне за таланты ИИ

Подробнее о InterSystems IRIS


1 - Forrester Opportunity Snapshot. (2019) Data Insights Are Key to Differentiated Customer Experience: A Unified Data Analytics Platform Enables Timely and Contextually Relevant CX2
-
h ttps://www.bls.gov/ooh/computer-and-information-technology/computer-and-information-research-scientists.htm3 -
h ttps://www.kaggle.com/headsortails/what-we-do-in-the-kernels-a-kaggle-survey-story4 - https://businessoverbroadway.com/2019/02/19/how-do-data-professionals-spend-their-time-ondata-science-projects/

Ресурсы для разработчиков

Сделайте следующий шаг

Мы будем рады поговорить. Заполните некоторые данные, и мы с вами свяжемся.
*Обязательные поля
Highlighted fields are required
*Обязательные поля
Highlighted fields are required
** Выбирая "да", вы даете согласие на получение информации о новостях, обновлениях и других маркетинговых целях, связанных с существующими и будущими продуктами и мероприятиями InterSystems. Кроме того, вы даете согласие на ввод контактной информации о вашем предприятии в наше решение CRM, которое размещено в США, но поддерживается в соответствии с действующим законодательством о защите данных.