​代表性的数据集、基准(预训练)模型、语料库、排行榜。本文选择一系列有一定代表性的任务对应的数据集,做为测试基准的数据集。这些数据集会覆盖不同的任务、数据量、任务难度。 ​

中文数据集下载

  • 中文语言理解测评基准: https://www.cluebenchmarks.com/dataSet_search.html
  • 阿里天池数据集:https://tianchi.aliyun.com/dataset/
  • 飞浆数据集:https://aistudio.baidu.com/aistudio/datasetoverview
  • FlyAI:https://www.flyai.com/c/nlp (数据导出有点麻烦)
  • github: https://github.com/

英文数据集下载

  • Kaggle: https://www.kaggle.com/datasets
  • github: https://github.com/

万能引擎

  • Google: https://www.google.com
  • Baidu:https://www.baidu.com/
Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐