|
|
东北大学研究团队发布TechGPT2.0大语言模型 |
|
近日,计算机科学与工程学院任飞亮副教授主持的“东北大学知识图谱研究组”发布了大语言模型TechGPT2.0。
TechGPT-2.0在继承了TechGPT-1.0全部特性的同时,通过增加多领域、多任务的数据,展现出了嵌套实体的抽取、幻觉回答、回答不可回答问题和回答长文本问题的能力。这些改进使得模型更适用于广泛的应用场景,为用户提供了更准确、更深入的信息处理和生成能力。
TechGPT2.0发布后,受到了学术界的广泛关注,“开放知识图谱”“机器学习算法与自然语言处理”“始智AI”等平台相继对TechGPT2.0的工作进行了介绍。并且,相应的模型也开源到了GitHub、HuggingFace、始智AI、魔塔等国内外开源社区,并提供了在线体验服务。
据悉,与研究小组2023年6月26日发布的TechGPT-1.0相比,TechGPT2.0新加了许多领域知识。除了TechGPT-1.0 所具备的计算机科学、材料、机械、冶金、金融和航空航天等10余种垂直专业领域能力,TechGPT-2.0 还在医学、法律等领域文本处理上展现出优秀的能力,并扩充了对地理地区、运输、组织、作品、生物、自然科学、天文对象、建筑等领域文本的处理能力。TechGPT-2.0还对幻觉、不可回答、长文本处理等问题进行了能力增强。同时,TechGPT-2.0对部署的硬件要求更低,使用NVIDIA 4090单机单卡或昇腾910A单机单卡就可完成TechGPT-2.0模型部署。
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。