Skip to content
搜索以了解InterSystems产品和解决方案,职业机会等。搜索结果包括来自我们的开发者社区、产品文档和教育网站的内容以及 InterSystems.com。
InterSystems IntegratedML

机器学习变得简单

用易开发、易部署的机器学习解决方案赢得人工智能人才大战

根据Forrester Research的数据,"98%的公司在利用所收集的数据获取洞察时会遇到挑战;这主要是由于缺乏内部专业知识。"1虽然您的组织今天或许能够在没有这些洞察力的情况下保持其竞争优势,但向数字化转型的变化速度可能很快会影响到您的业务。

因此,各地组织都专注于使用数据——并将其纳入人工智能(AI)和机器学习(ML)——以改善其业务。 有了ML,您可以改善业务运营并使之自动化,预测事件和行为,并根据这些预测主动执行规范的程序化行动。

例如,利用ML和预测分析,您的组织可以通过更好地了解消费者的行为和偏好来识别和锁定新买家,或者确定最佳销售时机。 如果您是医疗服务提供方,医疗机构可以分析编码诊断以及患者入院、转院和出院数据,以降低再次入院率。 简单地说,ML可以节省时间和资源,改善预测,使您能够做出更好的决策,得到更好的结果。

这听起来很好,但有一个缺点:开发ML模型是困难的,需要稀缺的、昂贵的专业知识。

幸运的是,行业专家正在努力通过开发新的工具,包括AutoML和IntegratedML®,使ML更容易使用。

IntegratedML技术简报

通过阅读这份技术简报,您会发现:

  • 为什么ML对您的业务成功至关重要
  • 人才短缺如何使企业利用ML时面临挑战
  • 什么是AutoML以及它如何帮您赢得AI人才战
  • InterSystems IntegratedML®是什么以及它是如何设计的:
    • 赋予您现有的软件开发人员开发ML模型和ML应用的能力。
    • 提高训练有素的数据科学家的生产力。
    • 简化运营和分析流程,以改善客户体验、运营效率和生产力。
    • 提高预测的准确性,创造更好的业务成果,并使您在竞争中脱颖而出。

本技术简报适合业务主管、经理和IT专业人士阅读,无论您是想扩大ML团队的生产力,还是刚开始使用ML而不需要雇佣ML专家。

下载技术简报

机器学习:价值

作为人工智能的一种应用,ML训练机器从经验和推理中学习数据。

ML可以分析广泛的数据,并创建用于满足大量分析和操作要求的模型。它可以不断改善结果,而不需要专门编程。 在线下,ML模型可以帮助企业用户了解客户行为,或流程效率问题,这只是一些应用的例子。 当在线部署时,或在企业的运营流程中,ML可以非常明显地提供改进的结果——无论是在客户浏览时向她推荐首选的产品或服务,还是在销售前主动提醒您,如果供应商有很高的风险无法交付,或在批准交易前确定交易是否可能是欺诈性的。 您的组织的每个部分的部门业务都可以从ML中受益,包括销售和营销、研究和开发、法律、人力资源、客户支持、产品开发,甚至财务。 事实是,ML几乎为每个行业提供了价值,并有望随着越来越多的组织接受而变得无处不在。

您已经在日常生活中体验到了ML:从亚马逊的Alexa和苹果的Siri等虚拟个人助理,到垃圾邮件过滤器和恶意软件检测器,从到Facebook推荐新朋友和新团体的方法,到提供在线客户支持的聊天机器人,以及自动驾驶的智能汽车。

机器学习:挑战

机器学习提供了许多好处,但它引出了一个问题:为什么没有更多公司使用它? 一个关键原因是:ML很难使用,需要高水平的专业知识。

ML需要了解理论、技术、方法和工具的专家。 今天,这些专家少之又少,需求量很大。 根据美国劳工统计局的最新数据,美国总共有不到32,000名数据科学家。2除了人工智能专家和数据科学家的短缺之外,大部分可用的人才都被亚马逊、Facebook、谷歌和微软等数字巨头所聘用,他们的工资高得令人咋舌。 这使得各企业难以争夺这些已经稀缺的资源。

AutoML:赢得AI人才战争

自动机器学习(AutoML)是一项蓬勃发展的新技术,适用于希望扩大其现有ML人才范围的企业,以及那些刚刚开始ML之旅的企业。

AutoML是一种相对较新的数据科学方法——它可以自动化并简化ML模型的创建。 它执行特征工程,使原始数据转换为适合ML模型的格式的过程自动化。 它自动进行模型选择、训练和结果分析——并以不同的参数测试不同的ML算法,为任何给定的问题创建最准确的模型。 对于拥有数据科学家团队的组织来说,这可以使许多用于建立ML模型的手动和试错过程自动化,并显著提高您的数据科学家的生产力,节省时间和精力。

如果您的员工中还没有ML专家,执行特征工程以及创建和训练模型可能是一个挑战。 但现在,有了AutoML,您的企业不一定需要数据科学家来创建有用的ML模型。 相反,您可以从简单的用例和AutoML开始,同时训练您的开发人员承担更多的分析和ML开发过程。

然而,现在许多AutoML工具是有限的。 虽然它们能够创建ML模型,但它们不提供任何在实时业务流程中运行这些模型的功能。 这是InterSystems IntegratedML与众不同的一个重要方式。

InterSystems的IntegratedML:将AutoML推向更高的境界

InterSystems IntegratedML是InterSystems IRIS®数据平台的一项嵌入式功能,是一个完整的数据管理软件环境。 IntegratedML提供了传统AutoML的所有功能和优点。 然而,由于它被嵌入到InterSystems IRIS中,您可以开发和部署复杂的应用程序,无缝地动态执行这些模型以响应实时事件和交易,而无需提取或移动任何模型或数据。

例如,一家发行信用卡的银行,需要在批准每笔交易之前识别欺诈风险。 它执行一个用InterSystems IRIS开发的实时、高性能的信用卡应用程序,该程序存储所有客户和信用卡交易的所有人口和财务数据。 这个应用程序可以包含每笔信用卡交易的数百个数据元素——包括每笔交易是欺诈性的还是有效的。

使用IntegratedML,银行现有的应用开发人员可以自动创建一个ML模型,根据过去的交易来识别高风险交易,只需选择所需的字段(如 "is_fraudulent"),让IntegratedML创建最合适的模型和参数。

但与传统的AutoML不同,基于InterSystems IntegratedML的模型可以被无缝集成到信用卡应用中,随着每一笔进入的交易实时执行,如果模型确定
,存在高欺诈风险,应用可以采取适当的程序化行动,如阻止交易,给卡主打电话和发短信。

IntegratedML还使应用在生产中运行和产生新数据时更容易保持模型的有效性。 就信用卡欺诈而言,由于一种欺诈模式被应用程序发现并阻止,犯罪分子肯定会启动新的技术。 由于所有的数据,包括最新的数据,都存储在数据平台内,因此不需要创建手动提取和移动数据到不同的环境。 相反,银行可以利用最新的数据不断完善模型,毫不拖延地检测和预防新的攻击模式。

有了InterSystems IRIS和IntegratedML,您可以开发应用程序,针对实时事件执行智能的规定性程序行动,获得关键的竞争优势和商业利益。 它可以帮助您率先将新产品或服务推向市场,率先对新举措采取行动,并率先对客户行为的变化做出反应。

IntegratedML:降低人才成本,提高生产力

有了IntegratedML,一个几乎没有ML知识的开发人员可以使用SQL来开发复杂的ML模型。

这并不是说您不应该雇用数据科学家。 如果您在一个拥有数据科学家团队的大型企业,IntegratedML可以为您的数据工程师和数据科学家节省大量时间。 例如,Kaggle ML和数据科学3在2018年进行的一项调查发现,数据科学家几乎花了40%的时间来收集和清理数据4(见下文图1)。 使用IntegratedML进行数据准备和特征工程,可以让您的数据科学家腾出手来专注于更重要、更高价值的任务,如优化模型。

对于刚刚开始使用ML的组织来说,InterSystems IntegratedML让那些正在构建您的业务应用并了解数据的软件开发人员和分析师自行探索ML。 IntegratedML将基本工作自动化,如确定最合适的模型,设置参数,以及建立和训练模型。 它也加快了将ML模型集成到生产应用中的过程。 随着您的开发人员变得更加成熟,并开始了解过程和结果,他们可以开始修改可选参数,并自己设置值。 数据科学家也可以通过IntegratedML提高工作效率,因为他们可以把时间花在实际的模型优化上,而不是处理数据和特征工程和选择。

developer reviewing code on laptop

InterSystems集成ML:如何工作

通过IntegratedML,模型训练,包括从源数据中识别适当的输入特征,调整模型参数,以及执行都是通过使用少量的SQL命令完成的。

CREATE MODEL WillSurvive PREDICTING (Survived) FROM Titanic

CREATE MODEL命令设置了机器学习模型元数据。 开发者指定了模型的名称(WillSurvive),要预测的目标字段(Survived)和一个数据集,以便从目标字段和所有模型输入字段(Titanic)中获取信息。 FROM语法是完全通用的,可以指定任何子查询表达式。 与此数据集相关的元数据也被用来推断目标字段和输入字段的数据类型,充分定义了模型要解决的问题。

TRAIN MODEL WillSurvive FROM Titanic

TRAIN MODEL命令指定了用于训练的数据并执行AutoML引擎,该引擎将一组关系数据作为输入。 由于FROM语法是通用的,同一个模型可以用不同的数据集进行多次训练。 例如,您可能想在不同的客户群上训练营销活动模型,或者随着新训练数据的出现,定期重新训练您的模型。

AutoML引擎自动处理所有需要的机器学习任务。 它从选定的数据中识别相关的候选特征,根据数据和问题定义考虑适用的模型类型,并调整超参数以产生一个或多个可运行的模型。

开发人员可以选择不同的AutoML引擎,包括InterSystems AutoML、H2O和DataRobot企业AI平台。 所有的AutoML引擎选项都无缝地集成在InterSystems IRIS中,对开发者是透明的。

SELECT PREDICT(WillSurvive) As Predicted FROM Titanic
SELECT PROBABILITY(WillSurvive FOR 1) FROM Titanic

一旦训练完成,模型通过两个标量函数之一,PREDICT()和PROBABILITY()提供结果。 PREDICT()返回由训练过的模型确定的指定列的最可能的或估计的值。 对于分类问题,PROBABILITY()返回训练过的模型的计算概率,该模型的目标字段将等于用户定义的值。 这些简单的标量函数可以在查询中的任何地方使用,并与其他字段和函数任意组合。 IntegratedML提供的关键创新之一是透明地将给定查询上下文中的可用字段映射到执行模型所需的输入字段。

IntegratedML为开发人员提供了额外的灵活性,例如,映射到其他数据源,而不是用于创建或训练模型的特定表格或查询,如以下例子所示。

SELECT Name, PREDICT(WillSurvive WITH Sex = Geschlecht, Age = DATEDIFF(year, NOW(), Geburtsdatum), Fare = TicketPreise, Cabin = Kabine) FROM Hindenburg

虽然大多数AutoML解决方案在一个独立的环境中运行,与外部数据平台和应用程序进行宽松、低吞吐耦合,IntegratedML则不同。 它在InterSystems IRIS数据平台内无缝运行,以加快和简化ML模型的训练和执行,并允许ML模型在InterSystems IRIS应用中无缝集成,而无需移动数据或模型。 ML模型的这种操作性被认为是在商业应用中迅速采用ML的最大障碍之一。

InterSystems IRIS数据平台

InterSystems的技术为全球各行各业的150,000个部署提供支持。 InterSystems IRIS数据平台是一个完整的数据管理软件平台,旨在加速和简化实时、数据驱动的应用程序的开发。 InterSystems IRIS允许开发人员将复杂的分析纳入实时、关键任务的业务流程,包括商业智能、人工智能、ML、自然语言处理和预测分析。

除了嵌入式ML开发和运行时功能外,InterSystems IRIS还实现了:

数据和应用集成——InterSystems IRIS提供了一套完整的集成和互操作能力,以清理、转换和规范数据,并支持复杂的集成。

此外,您可以将分析处理,如SQL查询、预测分析、ML和自然语言处理(NLP)嵌入到连接不同的数据源和应用的复合业务流程中。 这些复合流程可以简化操作,触发警报,并且在不影响应用性能的情况下进行。

可扩展性——InterSystems IRIS具有纵向和横向的可扩展性,并且具有很高的资源效率,这使得它非常适合于支持非常高容量的摄取率、高水平的分析工作负载、多并发的业务流程的应用,并且能够以经济有效的方式处理、存储和分析非常大的数据集。

报告和可追溯性——所有数据(包括飞行中的数据、元数据以及与长期运行的异步交易相关的数据)都自动存储在嵌入式数据库中,并可用于实时报告和分析。 通过可视化跟踪功能,可视化和诊断集成和流程的行为变得更加容易。

图形化开发——图形化的低代码工具使开发人员能够直观地描绘流程、转换、规则和工作流,从而使他们能够专注于系统之间的逻辑互动而不是编码。 图形化模型鼓励业务线和IT部门之间的协作,使您的企业能够更快地开发新的解决方案或修改现有的应用程序。

部署——InterSystems IRIS支持广泛的部署选项,包括所有主要的公共云、私有云、内部部署和混合部署选项。

无论您是想通过实时的个性化体验来取悦客户,改善患者的临床结果,还是在故障发生前主动预测维护需求,实时检测和防止欺诈,InterSystems IRIS和IntegratedML都可以帮助您实现这些目标,甚至更多。

了解有关InterSystems IRIS的详细信息

总结

机器学习是未来的浪潮,任何想要竞争的组织都需要开始使用它。 不幸的是,数据科学家很稀缺,他们的工资也在飙升,这使得不论是大型组织扩大其ML足迹,还是小型组织开始使用ML,都变得极具挑战性。 虽然像AutoML这样的创新很有帮助,但仅有AutoML是不够的。

InterSystems IntegratedML提供了复杂的AutoML功能,通过直观的SQL界面暴露出来,并完全集成在一个全面的数据平台中。 IntegratedML使得在实时、关键任务应用中部署ML模型变得容易,而不需要移动数据或模型,也不需要数据科学家。 InterSystems IRIS和IntegratedML结合在一起,使您能够创造一个良性的改进循环,不断完善ML模型,毫不拖延地响应最新的生产数据。

如果您有一个数据科学家团队,IntegratedML将提高您的团队生产力。

如果您刚刚开始人工智能之旅,IntegratedML可以让您现在就开始使用ML,而无需雇用昂贵的ML专家。

无论哪种情况,IntegratedML都可以帮助您。

  • 加快和简化ML模型的创建
  • 实时执行智能程序化行动
  • 简化流程,改善客户体验,提高运营效率和生产力
  • 提高预测的准确性,加速取得更好的业务成果,并在竞争中占得先机。
  • 用更少的资源更快、更容易地开发更智能的应用程序
  • 赢得AI人才战

了解更多关于InterSystems IRIS的信息


1 - Forrester Opportunity Snapshot。 (2019)数据洞察是客户体验差异化的关键:统一的数据分析平台能够实现及时的、与背景相关的用户体验
2 - https://www.bls.gov/ooh/computer-and-information-technology/computer-and-information-research-scientists.htm
3 - https://www.kaggle.com/headsortails/what-we-do-in-the-kernels-a-kaggle-survey-story
4 - https://businessoverbroadway.com/2019/02/19/how-do-data-professionals-spend-their-time-ondata-science-projects/

开发者资源

采取下一步行动

我们希望与您详细沟通,请您填写表格,我们将尽快与您取得联系。
*必须填写的字段
请填写必填字段
*必须填写的字段
请填写必填字段
** 选择 "是",表示您同意我们就现有及未来InterSystems产品和活动的新闻、更新和其他营销与您联系。此外,您同意将您的业务联系信息输入我们的CRM解决方案,该解决方案托管在美国,但按照适用的数据保护法进行维护。