天津一种医学文档专业词汇自动化标注方法(项目编号:ZL2023TJ3000149)交易公告
查看隐藏内容(*)需先登录
一种医学文档专业词汇自动化标注方法(项目编号:ZL****TJ*******)交易公告
发布时间:****-**-** **:**信息来源:天津市公共资源交易平台交易系统原文链接地址转让/许可标的基本情况标的名称一种医学文档专业词汇自动化标注方法项目编号ZL****TJ*******挂牌开始时间****-**-**挂牌截止时间****-**-**专利所属地中国专利类型发明专利专利号ZL************.*授权日期****-**-**到期时间****-**-**应用领域新一代信息技术简介本发明涉及一种医学文档专业词汇自动化标注方法,包括:对输入的医学文档进行数据预处理,得到预处理后的医学文档文本;获取词的字母级特征向量、单词级特征向量、语言特征向量并进行融合,作为词的编码向量;将分词后的医学文档文本的词标注分类得到标注数据集;对每一个词输出一个多维向量作为词的空间表示;获取增强后的标注数据集;进行训练建模,并最终输出标注结果。本发明设计合理,其采用半监督学习算法对大量未标注数据进行标注,成功地克服了现有医疗行业标注数据过少的缺陷,有效地提高了模型能够使用的数据量,并大幅提升算法对于关键词和专业词汇的标注准确率,可广泛用于医疗文献处理中。拟转让/许可方式拟交易底价采用一次总付的方式,在合同生效后**日内一次性全额支付所有使用费*****元人民币 。转让/许可方基本情况转让/许可方类型认证名称天津科技大学注册地址注册资本受让方资格条件转让/许可范围国内受让方资格条件无保证金要求无需交保证金