2 月 18 日-19 日,在悉尼举行的 Gartner 数据与分析峰会上,增强型数据分析和可解释的人工智能成为焦点。知名调研机构 Gartner 称,增强型数据分析、持续型智能和可解释的人工智能(AI)是数据和分析技术的主要趋势之一,并在未来三到五年内具有显著的颠覆性潜力。
Gartner 副总裁兼杰出分析师 Donald Feinberg 认为,数字化颠覆带来的挑战,也创造了前所未有的机遇。大量数据和由云实现的日益强大的处理能力意味着现在可以大规模地训练和执行必要的算法,以最终兑现出 AI 的全部潜力。
Donald 表示,「任何企业的持续生存都将取决于灵活的,以数据为中心的架构,以响应不断变化的速度。」
他还谈道,「数字化业务需要大量复杂且分布式的数据、迅速行动以及持续型智能,这意味着僵化且集中式的架构和工具分崩离析。」
Gartner 研究副总裁 Rita Sallam,数据和分析领导者必须审视这些趋势对业务带来的潜在影响,并相应调整业务模式和运营,否则就有可能失去竞争优势。
「数据和分析的形势不断发展,从支持内部决策到持续型智能,信息产品和任命首席数据官,」Rita 说道,「深入了解它们对于推动这种不断变化的技术趋势,并根据业务价值对它们进行优先排序至关重要。」
Gartner 建议数据和分析领导者与高级业务负责人讨论他们的关键业务优先级,并探索以下主要趋势如何实现这些优先级。
趋势 1:增强型数据分析(Augmented Analytics)
作为数据分析的高级增强阶段,增强分析能为分析计划带来更多自动化动能以及创新洞察力。因为在正式进入数据分析之前,都需要对数据进行抽取、清洗、融合等准备工作,以提高数据分析的效率和准确性,更利于决策。而增强分析则能够帮助普通用户在没有数据科学专家或IT人员协助的情况下,访问有效数据,并对理论和假设情况展开测试与验证。
增强型数据分析侧重于增强智能的特定领域,利用机器学习(machine learning)转变分析内容的开发、使用与共享方式。
目前国内正在加强这一技术突破的包括几大数据计算厂商,如阿里云、百度云、华为云等,通过对百万数据的计算与汇聚,实现对现实算力的优化,以在未来如智慧大脑领域实现更多突破。
Gartner预测,到 2020 年,增强分析将成为分析和商业智能解决方案的主要卖点,相关业务负责人应该在平台功能趋于成熟时率先采用增强型分析。
机器学习和人工智能、增强型分析将为数据和分析市场带来颠覆,因为它将彻底改变开发、消费和共享分析内容的方式,可使数据准备、洞察力获取和洞察力可视化这个过程实现自动化,在许多情况下无需专业的数据科学家。
趋势 2:增强型数据管理(Augmented data Management)
增强型数据管理利用机器学习功能和 AI 引擎来制作数据管理类别,包括数据质量、元数据管理、主数据管理、数据集成以及数据库管理系统(DBMS)自我配置和自我调整。
增强型数据管理将元数据由仅用于审计、沿袭和报告变成支持动态系统。元数据正在从被动变为主动,并且正在成为所有 AI / ML 的主要驱动因素。
它可以自动执行许多手动任务,为技术水平较低的用户提供使用数据的机会。它还有助于高技能的技术资源专注于更多的增值任务。
趋势 3:持续型智能(Continuous Intelligence)
持续性数据不仅仅是一种实时数据的新方式;相反,它是一种设计模式,其中实时分析与业务运营相结合,处理当前和历史数据以规定响应事件的行动。
它提供决策自动化或决策支持。持续型智能利用多种技术,比如增强型分析、事件流处理、优化、业务规则管理和机器学习。
「持续型智能代表了数据和分析团队工作的重大变化,」Gartner 研究副总裁丽 Sallam 人文,「分析和 BI(商业智能)团队在 2019 年帮助企业做出更明智的实时决策,这是一个巨大的挑战 - 也是一个巨大的机会。它可以被看作是运营商业智能的终极目标。」
到 2022 年,超过一半的重要新业务系统将采用持续性智能,使用实时上下文数据来改善决策。
趋势 4:可解释的 AI(Explainable AI)
人工智能模型越来越多地用于增强和取代人类决策。但 AI 解决方案如何解释为什么他们得出某些结论?
大多数这些先进的 AI 模型都是复杂的黑盒子,无法解释他们为何达到特定的推荐或决定。
这是可解释的人工智能的用武之地。
比如说,数据科学和机器学习平台中的可解释型AI可自动生成模型的解释,用自然语言从准确性、属性、模型统计和特征等方面解释模型。
趋势 5:图形分析(Graph)
图形分析是一组分析技术,可帮助企业探索交易,流程和员工等实体之间的关系。
到 2022 年,图形处理和图形数据库管理系统的应用将以每年 100%的速度增长。
根据 Gartner 的说法,图形数据存储可以跨数据孤岛有效地建模,探索和查询数据,但是对专业技能的需求限制了它们的采用。
由于需要在复杂数据中提出复杂问题,图形分析将在未来几年内增长,这在使用 SQL 查询时并不总是切实可行或甚至可能。
趋势 6:数据结构(Data Fabric)
数据结构都是关于单一且一致的数据管理框架。它着眼于在分布式数据环境中实现无摩擦访问和数据共享,而不是孤立存储。
到 2022 年,定制数据结构配置将主要用作静态基础架构,迫使组织进入新一波的成本控制浪潮,以完全重新设计更动态的数据网格方法。
趋势 7:NLP /会话分析(NLP/Conversational Analytics)
到 2020 年,50%的分析查询将通过搜索、自然语言处理(NLP)或语音生成,或者将自动生成。
分析复杂的数据组合并使组织中的每个人都可以访问分析的需求将推动更广泛的采用,使分析工具将如同搜索界面或与虚拟助手的对话一样简单。
根据另一项单独研究,NLP 用例非常庞大,预计到 2020 年 NLP 市场价值将达到 134 亿美元。
趋势 8:商用的人工智能和机器学习(Commercial AI and ML)
到 2022 年,75%利用 ML 和 AI 技术的新终端用户解决方案将采用商业解决方案,而非开源平台的方式构建。
商业供应商已经在开源生态系统中创建了连接器,它们为组织提供了扩展 AI 和所需的功能,例如项目和模型管理、透明度、复用、数据沿袭、平台凝聚力以及开源技术所缺乏的集成。
趋势 9:区块链(Blockchain)
企业可以使用区块链来解决数据管理问题吗?
数据管理对 CTO 来说是一个持续不断的挑战,但 Bluzelle 首席执行官 Pavel Bains 认为区块链技术可以提供解决方案。
区块链和分布式账本技术的核心价值主张是在不受信任的参与者网络中提供去中心化的信任。区块链对于数据分析的潜在影响很大,尤其是对利用参与者关系和交互的那些企业的影响。
然而,在四到五个主要区块链技术成为主导之前,还需要几年时间。
但是,区块链是数据源,而不是数据库,不会取代现有的数据管理技术。
趋势 10:持久性内存服务器(Persistent Memory Servers)
持久存储器技术旨在降低采用内存计算(IMC)的架构的成本和复杂性。持久性内存代表 DRAM 和 NAND 闪存之间的新内存层,可为高性能工作负载提供经济高效的大容量内存。
「数据量正在激增,实时将数据转化为价值的紧迫性正以同样快的速度增长,」Donald 表示,「新的服务器工作负载不仅要求更快的 CPU 性能,还要求大容量内存和更快的存储系统。」