`
fuhao_987
  • 浏览: 61756 次
  • 性别: Icon_minigender_2
  • 来自: 北京
社区版块
存档分类
最新评论

统计自然语言处理基础——学习摘要(1)

    博客分类:
  • NLP
阅读更多
句子边界的启发式检测算法:
(1)在.?!(和可能的;:-)出现位置之后加一个假设的句子边界。
(2)如果假设边界后面有引号,那么把假设边界移到引号后面。
(3)除去以下情况中句点的边界资格:
     -如果在句点之前是一个不总出现在句子末尾的众所周知的缩写形式,而且通常后面会跟一
      个大写的名字,例如Prof.或者vs.。
     -如果句点前面是一个众所周知的缩写形式,但是句点后面没有大写词。这样即可正确地处
      理像etc.或者Jr.这样的大多数缩写用法,这些缩写一般出现在句子的中间或者末尾。
(4)如果下面的条件成立,则除去?或者!的边界资格:
     -这些符号后面跟着一个小写字母(或者一个已知名字)。
(5)认为其他假设边界就是句子的边界。

检测句子边界可以看出是一个分类问题。
分享到:
评论

相关推荐

    自然语言处理.zip

    摘要:教机器阅读自然语言文档仍然是一个难以应付的挑战。对于看到的文档内容,我们可以测试机器阅读系统回答相关问题的能力,但是到目前为止,对于这种类型的评估仍缺少大规模的训练和测试数据集。在这项工作中,...

    性能测试进阶指南——LoadRunner11实战 part1

    第1章 性能测试基础 1.1 性能测试工程师的标准及挑战 1.1.1 性能测试工程师的考评指标 1.1.2 性能测试工程师的挑战 1.2 性能测试基础 1.2.1 性能定义 1.2.2 性能指标 1.2.3 单机与网络性能测试 1.2.4 性能测试的流程...

    性能测试进阶指南——LoadRunner11实战 part2

    第1章 性能测试基础 1.1 性能测试工程师的标准及挑战 1.1.1 性能测试工程师的考评指标 1.1.2 性能测试工程师的挑战 1.2 性能测试基础 1.2.1 性能定义 1.2.2 性能指标 1.2.3 单机与网络性能测试 1.2.4 性能测试的流程...

    性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part1

    性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part1 性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part2 性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part3 性能测试进阶指南——...

    运动会分数统计-数据结构课程设计

    任务:参加运动会有n个学校,学校编号为1——n。比赛分成m个男子项目,和w个女子项目。项目编号为男子1——m,女子m+1——m+w。不同的项目取前五名或前三名积分;取前五名的积分分别为:7、5、3、2、1,前三名的积分...

    性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part2

    性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part1 性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part2 性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part3 性能测试进阶指南——...

    性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part5

    性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part1 性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part2 性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part3 性能测试进阶指南——...

    性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part4

    性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part1 性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part2 性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part3 性能测试进阶指南——...

    性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part6

    性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part1 性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part2 性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part3 性能测试进阶指南——...

    性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part3

    性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part1 性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part2 性能测试进阶指南——LoadRunner11实战_(完整)扫描版_@vs.part3 性能测试进阶指南——...

    性能测试进阶指南——LoadRunner11实战 part3

    第1章 性能测试基础 1.1 性能测试工程师的标准及挑战 1.1.1 性能测试工程师的考评指标 1.1.2 性能测试工程师的挑战 1.2 性能测试基础 1.2.1 性能定义 1.2.2 性能指标 1.2.3 单机与网络性能测试 1.2.4 性能测试的流程...

    文件批量处理百宝箱 v10.0 Build 20160223.zip

    文件批量处理百宝箱提供了几十种功能丰富强大的文件批量更名功能,以及支持世界各国语言的源匹配多国语言版批量更名功能。文件批量处理百宝箱能够对 图片压大小缩尺寸,按指定大小或尺寸压缩图片,图片转灰度,MP3...

    JAVA上百实例源码以及开源项目源代码

     Tcp服务端与客户端的JAVA实例源代码,一个简单的Java TCP服务器端程序,别外还有一个客户端的程序,两者互相配合可以开发出超多的网络程序,这是最基础的部分。 递归遍历矩阵 1个目标文件,简单! 多人聊天室 3...

    asp.net知识库

    技术基础 New Folder 多样式星期名字转换 [Design, C#] .NET关于string转换的一个小Bug Regular Expressions 完整的在.net后台执行javascript脚本集合 ASP.NET 中的正则表达式 常用的匹配正则表达式和实例 经典正则...

    AI抢饭碗成真!近500家美国企业用ChatGPT取代员工

    另外,有58%的企业将其用于文案或内容创建,57%用于客服,52%用于创建会议或文档摘要。 △本文所有统计图表均源自:Resume Builder官网 还没完呢——ChatGPT甚至还参与了招聘,比如撰写职位描述、回复求职者等等。...

    java web 视频、电子书、源码(李兴华老师出版)

    9.11.4、监听器实例 —— 在线人员统计 9.12、本章摘要 9.13、开发实战讲解(基于Oracle数据库) 第10章 表达式语言 10.1、表达式语言简介 10.2、表达式语言的内置对象 10.2.1、访问四种属性范围的内容 ...

    李兴华Java Web开发实战经典.pdf (高清版) Part1

    9.11.4、监听器实例 —— 在线人员统计 9.12、本章摘要 9.13、开发实战讲解(基于Oracle数据库) 第10章 表达式语言 10.1、表达式语言简介 10.2、表达式语言的内置对象 10.2.1、访问四种属性范围的内容 ...

    李兴华 Java Web 开发实战经典_带源码_高清pdf 带书签 上

    9.11.4、监听器实例 —— 在线人员统计 9.12、本章摘要 9.13、开发实战讲解(基于Oracle数据库) 第10章 表达式语言 10.1、表达式语言简介 10.2、表达式语言的内置对象 10.2.1、访问四种属性范围的内容 ...

    MLDN+李兴华+Java+Web开发实战经典.part3.rar )

    9.11.4、监听器实例 —— 在线人员统计 9.12、本章摘要 9.13、开发实战讲解(基于Oracle数据库) 第10章 表达式语言 10.1、表达式语言简介 10.2、表达式语言的内置对象 10.2.1、访问四种属性范围的内容 ...

    李兴华 java_web开发实战经典 源码 完整版收集共享

    9.11.4、监听器实例 —— 在线人员统计 9.12、本章摘要 9.13、开发实战讲解(基于Oracle数据库) 第10章 表达式语言 10.1、表达式语言简介 10.2、表达式语言的内置对象 10.2.1、访问四种属性范围的内容 ...

Global site tag (gtag.js) - Google Analytics