跳转到主要内容
Chinese, Simplified

人工智能数据目录在您的数据庄园中搜索元数据,然后对其进行处理,以自动化数据工作流程,并提供智能建议,丰富数据发现、探索、文档和治理。

有了人工智能数据目录,你可以在几秒钟内获得所需的所有数据和上下文,这样你就可以做出更好、更有洞察力的决策。让我们了解人工智能在数据编目中的可能性,然后探索人工智能数据编目的商业影响。

什么是人工智能数据目录?

人工智能数据目录是一种现代数据目录,它使用自动化和智能推荐来抓取、收集和处理元数据,优化数据文档、搜索、发现和探索。它能够从资产的元数据中提取上下文,帮助数据从业者多思考、少工作、提高效率。

https://youtu.be/FE1WnYYT3yk

根据Gartner的说法,人工智能数据目录“自动化了数据编目中涉及的各种繁琐任务,包括元数据发现、摄入、翻译、丰富,以及元数据之间语义关系的创建。”

对于被视为人工智能数据目录的数据目录,它应该:

  • 为数据文档提供自动建议-业务词汇表、数据资产描述、自述文件
  • 建议您可以询问的有关数据的问题
  • 自动完成和编写SQL查询,增强现有查询脚本并修复错误,以便每个人都可以探索数据集
  • 支持整个数据庄园的自然语言搜索
  • 搜索数据时推荐类似资产
  • 自动建议和更新数据标签,以便您可以轻松地对数据进行大规模分类
  • 运行自动质量检查,并在资产或管道出现问题时提醒合适的人员

人工智能的世界在不断发展,创新方面的突破每天都在取得。例如,微软最近在OpenAI上投资了100亿美元,GitHub推出了一款名为Copilot的配对编程AI,文本和图像处理聊天机器人GPT-4现在也可以使用了。人工智能的这些令人难以置信的进步开辟了新的可能性,并显示了人工智能在改变和革命各种工作流程方法方面的潜力。

因此,人工智能如何改变你的数据编目体验的可能性也是无穷无尽的。

为什么你需要关心你的数据目录是否具有人工智能功能?

人工智能数据目录可以帮助数据从业者在日常工作中提高生产力和效率。

Gartner表示,“人工智能可以协助数据准备、洞察生成和洞察解释。它通过自动化数据科学、机器学习以及人工智能模型开发、管理和部署的许多方面,为专家和公民数据科学家提供支持。”

以下是《福布斯》如何强调人工智能在编目中的可能性。有了人工智能数据目录,首席营销官可以问这样的问题:“在过去的18个月里,我们最新产品线的印刷和数字广告支出的回报是多少?”

如果没有人工智能数据目录,即使是确定回答这些问题所需的数据点,也需要IT部门的参与,而IT部门由于其他优先事项的积压,可能会在几周内得到答案。有了人工智能支持的现代数据目录,用户可以在几分钟内自己寻找并找到这些问题的答案。

阅读更多关于人工智能如何为数据目录工作流程提供动力的信息——可以节省时间,提高效率,并大规模从数据中提取价值。

人工智能数据目录对业务的影响是什么?

人工智能已经在改变我们的工作方式,很容易想象它给我们的数据交互和体验带来的可能性。当我们感到兴奋时,让我们考虑如何使用人工智能数据目录来推动业务成果。

  1. 通过更快、更高效的数据发现节省成本
  2. 大规模发掘新机会,推动收入增长
  3. 使用自动化和智能数据文档建议,减少工作量
  4. 通过确保所有应用程序的数据一致性来减少数据混乱
  5. 无需代码数据探索即可缩短洞察时间
  6. 改进数据安全、隐私和法规遵从性,以避免昂贵的罚款并建立信任

让我们看看如何。

1.通过更快、更高效的数据发现节省成本

人工智能数据目录可以在您的整个数据庄园中搜索元数据,以提高数据搜索和发现工作的准确性和相关性。

数据从业者可能会花费数小时搜索他们想要的数据——平均每位员工每天花费3.6小时搜索信息。IT团队花半天时间(4.2小时)寻找相关信息以支持业务用户请求。

有了人工智能数据目录,数据从业者可以减少寻找正确数据所需的工作量。他们可以使用类似谷歌的搜索界面询问有关数据的问题,并获得闪电般的搜索结果。

这意味着每天至少可以节省3个小时,从而显著节省时间和成本。

2.大规模发现新机会,推动收入增长

数据从业者可以大规模发现新的机会,因为人工智能数据目录可以分析和解释整个数据产业的元数据。

因此,每当你寻找某种资产时,人工智能也会为类似的数据资产提供建议,这样你就可以更好地理解数据资产关系。按照谷歌搜索中的“人们也会问”和“与…相关的搜索”部分来思考

如果没有人工智能,建立这样的连接可能需要几天时间。在某些情况下,你可能会完全错过它们——“未知的未知”,即你甚至不知道的事情。

HBR通过本案例研究解释了“未知的未知因素”:

“GNS Healthcare应用机器学习软件来发现患者健康记录和其他地方的数据之间被忽视的关系。在确定了一种关系后,该软件大量提出了许多假设来解释它,然后提出了其中哪些最有可能。因此,GNS发现了隐藏在非结构化患者笔记中的一种新的药物相互作用。”

人工智能数据目录如何帮助做类似的事情?

人工智能数据目录可以研究客户行为的元数据,以建立联系并提供见解。因此,例如,如果你搜索某个客户的购买历史,人工智能数据目录可能会建议查看同一客户的服务请求或反馈数据。

3.数据文档的自动化和智能化建议减少了工作量

人工智能数据目录可以研究相关资产的元数据,为数据描述、词汇表、自述文件等提供自动建议。然后,数据从业者可以选择接受、修改或拒绝这些建议。

这一过程可能需要数小时,并导致不一致。例如,不同的团队可以用不同的方式解释“收入”:

  • 销售团队可能认为收入是从客户那里收到的金额
  • 营销团队可以将收入解释为营销活动产生的资金
  • 财务团队的解释可能是扣除取消或退款后的金额
  • 高管可以将收入解释为其组织的整体财务健康状况

将这些术语标准化并确保所有团队保持一致对于确保每个人都站在同一立场至关重要。

人工智能可以从类似的数据资产中抓取元数据,以自动填充数据描述和定义,从而完全避免此类难题。因此,数据从业者花费更少的时间和精力手动记录数据,并依靠智能建议进行大规模记录。

4.通过确保所有应用程序的数据一致性来减少数据混乱

人工智能数据目录,尤其是由活动元数据提供支持的数据目录,也实现了元数据的双向流动。如前所述,人工智能可以通过智能建议加快数据文档的编写速度。

数据从业者还可以在所有应用程序中对数据描述、证书、所有者、分类、状态和其他此类元数据执行批量更新。因此,您的整个数据产业是同步的,每个人都可以访问一致且新鲜的数据。

5.减少洞察时间,无需代码数据探索

人工智能数据目录可以帮助业务用户编写SQL查询,并通过英语提示理解现有脚本。人工智能还可以审查代码,发现错误,并提供修复建议,这样你就不必依赖IT来查询数据了。

在没有人工智能的情况下,这一过程包括向IT或工程部门提交请求。他们可能需要几个小时甚至几天才能回来。

即使他们回来了,结果也可能不是你所需要的,因为业务和IT团队用不同的视角查询数据。虽然业务用户试图将数据中的见解与直接影响整体业务的项目指标联系起来,但IT可能没有这种背景。

《福布斯》就业务和IT团队如何看待数据的问题进行了总结:

“高管们通过战略、销售增长、目标市场、竞争威胁、客户体验和公司使命来处理业务问题。IT专业人士从一个截然不同的角度看待世界。”

人工智能使业务用户能够自己探索数据,这也腾出了IT或中央数据团队用于支持业务请求的时间,以便他们能够专注于数据质量、安全性和可用性。

6.改善数据安全、隐私和法规遵从性,以避免昂贵的罚款并建立信任

人工智能数据目录可以帮助您根据类似数据资产的标签自动标记数据并通过沿袭传播数据。因此,如果你已经将患者记录识别为PII,那么人工智能数据目录会编译相关资产,并建议将其标记为PII。

该目录还将通过跟踪资产在各种工作流中的行程,确保将正确的数据加密、屏蔽和匿名化策略应用于PII资产。这有助于您避免法规遵从性问题,并确保数据隐私和完整性。

就像分类和加密一样,人工智能数据目录也可以通过沿袭传播访问控制策略。此外,它还可以通过研究类似资产的元数据,为拥有或修改数据资产的人提供建议。这有助于监控数据访问和安全性。

使用人工智能数据目录,您可以降低与数据错误、合规问题和低效工作流程相关的成本。

此外,由于数据在整个生命周期中都得到了正确的分类、标记和跟踪,因此您可以知道数据来自何处,如何处理,以及谁可以访问数据。这可以建立对数据可靠性和质量的信任。

以下是人工智能数据目录的功能

https://youtu.be/oQTPopOMkzo

总结

人工智能在数据编目方面与电信行业的iPhone时代相似。从数据发现到探索,人工智能可以为许多用例提供动力,自动化重复任务,并使数据团队离100%自助分析更近一步。

将人工智能数据目录视为一个始终开启的智能工作空间,它充当数据庄园的上下文、控制、协作和行动平面。

人工智能数据目录可以让数据从业者花更少的时间做繁重的工作,花更多的时间解决可以推动收入增长、发现商机和提高效率的问题。

准备好获取人工智能数据目录了吗?注册加入候补名单。

AI数据目录:相关阅读

原文地址
https://atlan.com/ai-data-catalog/
本文地址
Article

微信

知识星球

微信公众号

视频号