数据优先:您GenAI启动平台的关键基础

博客和文章

生成式AI为政府执行任务的方式开辟了新领域,但GenAI的性能完全取决于为其提供动力的数据质量。您的数据基础有多坚实?

Mary Ellen Buzzelli
Mary Ellen Buzzelli
2024年11月12日7 分钟
Data First: The Critical Foundation for Your GenAI Launchpad

在过去的一年里,GenAI因其彻底改变企业设计和提供数字服务方式的潜力而占据了媒体头条。虽然政府机构已经以聊天机器人、社交媒体监控、预测性政策制定等多种形式接纳了AI,但GenAI分析海量数据、模拟人类推理以及适应动态情境的能力,为政府执行任务的方式开辟了新领域。

事实上,在NASCIO最近的一项调查中,53%受访的州CIO表示,GenAI将是未来3-5年内最具影响力的新兴信息技术领域。NASCIO发布的2024年州CIO十大优先事项清单中,甚至首次纳入了AI。

很明显,各州和地方政府对GenAI充满期待,但是否已经准备好利用它来实现真正的价值呢?

构建您的GenAI启动平台

据NASCIO称,只有27%的州CIO表示,他们对企业信息管理拥有成熟的治理体系——这是实施GenAI的关键和基础要素。像许多新兴技术应用一样,GenAI的性能完全取决于它进行推理的信息质量,而这些信息必须以一种GenAI能能够理解的形式进行打包和输入。也就是说,信息必须是以结构化、数字化且可访问的形式存在,这样才能用于分析、共享和辅助决策。

数据是推动创新的命脉。坚实的数据基础是开发强大且可靠的GenAI模型的基石。以下是建立坚实数据基础的四个关键要素:

  1. 数据数字化和标准化:
  2. 纸质档案数字化:利用光学字符识别(OCR)技术,将纸质档案转换为数字格式,并自动生成有意义的元数据
  3. 数字数据标准化:应将数字化档案和现有数字数据整合到一个集中存储库中。.标准化要求以统一的方式组织数据,例如使用通用的文件格式、命名约定和数据结构。
  4. 实施数据质量管控
  5. 数据清洗与验证:识别并纠正数据中的错误、不一致和不准确之处。合适的数字化工作将自动完成此过程,同时人工的参与以确保准确性。
  6. 执行数据录入标准:为新数据的录入建立指导方针,包括验证规则、审核流程以及面向未来的纸质档案数字化,以从源头上防止错误。
  7. 创建元数据与分类体系
  8. 生成元数据:除了档案级别的元数据外,还要为每个数据集开发元数据,包括数据的来源、创建日期以及任何相关的上下文细节。 这些元数据对于理解数据的含义和来源至关重要。
  9. 构建分类体系:创建结构化的分类或分类体系,以定义数据内部的关系和分类。 这有助于组织信息,并促进更高效的搜索和分析。
  10. 实施数据治理
  11. 明确数据所有权和责任:在企业内明确分配不同数据集的所有权和责任。 这可以确保问责制,并有助于维护数据质量。
  12. 制定数据治理政策:制定并强制执行关于数据访问、安全性和隐私的政策。这包括明确谁有权限修改或删除数据,以及为数据共享设定指导方针。
  13. 虽然必须根据每个州的特定需求、战略计划和优先事项定制AI路线图,但包含这些重要考虑因素可以确保为AI无缝融入州IT举措奠定坚实的数据基础。随着我们看到越来越多的州实施GenAI,我们对管理这项技术的最佳实践有了更深入的了解。Kansas、New Jersey和Washington等州已经发布了州GenAI政策,为即将跟进的其他州树立了范例。

    政府在运用GenAI方面的未来前景广阔,但州和地方领导人有责任将基础数据要素作为优先事项,以使GenAI成为安全和战略性资产。

    要了解更多关于Iron Mountain如何帮助推动您的GenAI之旅的信息,请与我们联系