7*24小时服务热线:
4000-365-960
2023-10
新闻类内容数据总计约35G左右;每个新闻类内容包含ID、时间、新闻标题及新闻内容;该数据可用于大型语言模型(LLM)训练、chatgpt等任务。
2023-10
普通话发音词典包含570,060个中文普通话词条以及对应的拼音,所有词语及发音均由语言学专家制作,适用于普通话语音识别技术研发。
2023-10
222,289张中文自然场景OCR数据采集场景涵盖室内和室外场景。数据多样性包括多种场景和多种拍摄角度。在标注方面,对图像中文字进行行级标注、单词级标注、字符级标注和内容转写。本套中文自然场景OCR数据可用于自然场景OCR任务。
2023-10
50人中文三风格平均音色合成库,由中文母语发音人录制,每人录制客服类、播音类、故事类三种风格的数据,语料音素覆盖均衡,专业语音学家参与标注,精准匹配语音合成的研发需求。
2023-10
terspeech2,020口音英语语音识别竞赛数据的背景是数据堂在2020年interspeeh会议上举办了口音英语识别竞赛,数据集来自数据堂自有的8套各国人说英语语音数据集。Interspeech2,020口音英语语音识别竞赛数据文本经过人工校对,准确率高;可应用于语音识别、机器翻译。
2023-10
500人驾驶员手势识别数据涵盖多年龄段、多时间段、多种手势。在采集设备方面,采用了可见光和红外双目摄像头。每人采集18种静态手势和23种动态手势,静态手势包含握拳手势、比心手势等,动态手势包含食指点击和双指点击等。本套驾驶员手势识别数据可用于驾驶员手势识别等任务。