基于CRF工具的机器学习方法命名实体识别的过程

这里只讲基本过程，不涉及具体实现，我也是初学者，想给其他初学者一些帮助，如有不对，请多包涵

方法/步骤

语料的收集整理。部分专业有完整的语料库（包括训练语料和测试语料，这些语料不需要再进行人工标注）。如果没有，个人就要根据专业需求上网上用工具抓取，下载，预处理（对中文语料需要进行分词处理和词性标注预处理），同时要对训练预料进行人工标注，很浪费时间。个人建议初学者直接在能找到的专业语料库上做实验。

根据专业需求选取要抽取的特征，制定特征模板。这个过程参考专业领域的论文，一般好的特征别人都提到过。选取特征之后这里要跑程序，将语料格式根据选取的特征转化为CRF模型所要求的语料格式（这个程序一般要自己写，因为特征不一样）。

这个测试结果不能直接进行评价，要先测试结果转化为可以评价的格式（这里也是需要跑程序）。转化后评测。目前我知道的是在UNIX系统下评测，有UNIX服务器的最好，用 FlashFXP软件登陆服务器，用putty软件进行评测。putty评测命令：perl alt_eval.perl test.e > test-1(test.e是可以被评测的经过CRF模型测试过的测试语料格式，是经过my Eclipse转化而来。test-1是存放评测结果的文件，如果不定义，结果直接显示在控制台)。

上一篇：哈利波特魔法觉醒课堂种类有哪些

下一篇：如何下载UCI机器学习数据集

欧尼酱

基于CRF工具的机器学习方法命名实体识别的过程

基于CRF工具的机器学习方法命名实体识别的过程

如何做出来和KFC味道差不多的蛋挞

上海财经大学金融专硕考试科目及参考书目推荐

怎样制作超好吃的蛋挞？

企业融资与风险管理实务的关系

2018广东国家公务员考试报名条件之基层工作经验

每个人都要了解的理财知识

幻塔糖纸位置介绍

大学毕业之后一个月该办理的手续有哪些？

职场“孤独期”应该如何轻松的度过

负债融资对企业的作用是什么？

塔塔糖真的打虫吗

怎么判断公司的真实性

做期货必读的几本期货书

幻塔纸糖任务完成攻略

投资理财知识！

企业性质不同，如何做好工作？

红糖核桃塔的简单做法

大学生就业心理学

SWU留学：[576]美国金融专业终极解密