博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
用深度学习做命名实体识别(一):什么是命名实体识别?
阅读量:4332 次
发布时间:2019-06-06

本文共 1015 字,大约阅读时间需要 3 分钟。

上一个深度学习系列介绍了如何检测出图片或视频中的物体,本深度学习系列将介绍如何从文章中提取出我们关注的实体,比如提取文章中出现的人名、地址、产品、时间等实体。本文做为该系列的第一篇文章,会先呈现一下命名实体识别的效果,然后给大家介绍几个概念。
识别效果
 
 
 
 
 
如上图所示,请求体中是要提取实体的句子,也可以是短文,接口返回的就是句子中识别出来的各种实体。
要实现以上的效果,还得先从了解以下内容开始。
 
什么是命名实体识别?
从一句话中识别出人名,地名,组织名,日期时间,这就是命名实体识别的一个例子,而人名,地名等这些被识别的目标就是命名实体。当然命名实体还可以是很多其它有意义的目标,比如产品,公司,专有名词等等。
 
什么是文本数据标注?
了解过机器学习的朋友都知道,无论是传统的机器学习还是深度学习,大多数情况都是在做监督学习,也就是需要大量标注好的数据做为训练样本,那么这里,如果希望机器能识别出人名,地名,就必须事先给机器看看在一句话中,什么是人名,什么是地名,当然只看一句话是远远不够的,一般来说,至少也要上千句话才可以。这些句子都是需要人工来标注的,而标注出这些句子中的命名实体的过程,称为"文本数据标注"。
 
怎么做文本数据标注?
数据标注,最粗暴的方式,就是直接在word、txt等文档里标注,比如像下面这样:
此次{
{location:中国}}个展,{
{person_name:苏珊}}将与她80多岁高龄的父亲一起合作,哼唱一首古老的{
{location:威尔士}}民歌{
{product_name:《白蜡林》}}。届时在{
{location:画廊大厅}}中将安放6个音箱进行播放,艺术家还特意回到家乡{
{location:格拉斯哥}},同父亲一起在{
{org_name:中国音乐学院}}里为作品录制了具有{
{location:中国}}元素的音乐片段。
但是这样做有以下弊端:
  • 白底黑字,密密麻麻,很快就会看花眼了,很容易标注错误,比如少个符号什么的;
  • 无法多人协同标注。
因此,已经有很多大牛们研发了许多协助标注文本的工具,其中一个笔者觉得比较好用的工具——brat,将在下一篇文章《用深度学习做命名实体识别(二):文本标注工具brat》中介绍。
 
ok,本篇就这么多内容啦~,感谢阅读O(∩_∩)O,88~

转载于:https://www.cnblogs.com/anai/p/11447151.html

你可能感兴趣的文章
小D课堂 - 新版本微服务springcloud+Docker教程_3-01 什么是微服务的注册中心
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_3-03CAP原理、常见面试题
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_3-04 SpringCloud微服务核心组件Eureka介绍和闭源后影响...
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_3-05 服务注册和发现Eureka Server搭建实战...
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_3-06 服务注册和发现之Eureka Client搭建商品服务实战...
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_3-07 Eureka服务注册中心配置控制台问题处理...
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_4-01 常用的服务间调用方式讲解
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_4-02 微服务调用方式之ribbon实战 订单调用商品服务...
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_4-03 高级篇幅之Ribbon负载均衡源码分析实战...
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_4-06 Feign核心源码解读和服务调用方式ribbon和Feign选择...
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_4-05 微服务调用方式之feign 实战 订单调用商品服务...
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_5-02 Netflix开源组件断路器
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_5-01分布式核心知识之熔断、降级
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_5-04 feign结合hystrix断路器开发实战下...
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_5-03 feign结合hystrix断路器开发实战上...
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_6-01 微服务网关介绍和使用场景
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_5-05熔断降级服务异常报警通知
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_6-03 高级篇幅之zuul常用问题分析
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_5-08 断路器监控仪表参数
查看>>
小D课堂 - 新版本微服务springcloud+Docker教程_6-02 springcloud网关组件zuul
查看>>