首页 > 科技创新> 创新动态

我院数据集首批落地北京数据基础制度先行区

发布时间:2024年04月02日 14:13

成果发布环节

成果发布环节

首批100个高质量数据集

首批100个高质量数据集

3月29日下午,以“数据驱动,智绘未来”为主题的2024北京AI原生产业创新大会暨北京数据基础制度先行区成果发布会在北京经济技术开发区(北京亦庄)举办。本次大会由北京市发展和改革委员会,北京市经济和信息化局,北京市科学技术委员会、中关村科技园区管理委员会,北京市市场监督管理局,北京市政务服务和数据管理局,北京市通信管理局,北京经济技术开发区管理委员会,北京亦庄投资控股有限公司主办。大会发布了北京经开区AI原生产业政策、点亮人工智能公共算力平台3000P智能算力并投入使用、启用北京人工智能数据训练基地、发布多个创新平台、落地多个重点项目,用AI打造新质生产力“强引擎”。

在北京数据基础制度先行区成果发布环节,北京市科学技术研究院(以下简称“北科院”)数据集入选第一批人工智能大模型高质量训练数据集,院数字经济所代表我院作为首批数据提供方代表受邀参加发布仪式环节。第一批人工智能大模型高质量训练数据集由北京国际大数据交易所联合北京人工智能产业联盟牵头发起,联合北科院及中科院大气物理所、中国知网、中汽智联、北方健康、中文在线、中国搜索、牡丹集团等36家机构及企业提供的大模型语料训练数据,共同为北京数据基础制度先行区人工智能训练场示范基地建立模型训练语料资源库。首批发布的数据集数据总量逾150PB,覆盖多模态语料,涉及科技创新、金融服务、医疗健康等20个领域应用场景。

此次北科院入选的数据集由科学数据专区进行筛选、评估,同北京国际大数据交易所进行多次对接协调,最终选取了院分析测试所、系统工程所、科技情报所、计算中心、北京天文馆等单位的59项数据集分18个类别入选至第一批人工智能大模型高质量训练数据集,将为人工智能数据训练基地大模型训练提供更加精准、可靠的数据服务,有力支撑我市人工智能产业的创新发展。

北科院作为首批入驻北京数据基础制度先行区的机构,未来将持续加强科学数据专区建设运营工作,在挖掘数据要素价值、加大人工智能大模型数据供给、探索数据高效流通和创新应用等方面潜心耕耘,与合作伙伴共同构建人工智能协同创新产业合作生态,为国际科技创新中心建设和数字经济标杆城市建设贡献力量。

(数字经济创新研究所)