博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
基于R的拼写纠正器
阅读量:4980 次
发布时间:2019-06-12

本文共 1032 字,大约阅读时间需要 3 分钟。

mom=readLines("http://www.norvig.com/big.txt")mom1=tolower(paste(mom,collapse=" "))mom2=strsplit(mom1,"[^a-z]+")mom3=sort(table(mom2),decreasing = TRUE)want=names(mom3)corrector=function(needCorrect){  y=want[adist(needCorrect,want)==min(adist(needCorrect,want),2)]  return(c(y,needCorrect)[1])}> corrector("hia")[1] "his"> corrector("andd")[1] "and"> corrector("fof")[1] "of"

 

Modify a little bit, only the word with same letters(if it exist) will be returned.

mom=readLines("http://www.norvig.com/big.txt")mom1=tolower(paste(mom,collapse=" "))mom2=strsplit(mom1,"[^a-z]+")mom3=sort(table(mom2),decreasing = TRUE)want=names(mom3)corrector=function(needCorrect){  y=want[adist(needCorrect,want)==min(adist(needCorrect,want),2)]  if (length(y)>1) {      y=y[nchar(y)==nchar(needCorrect)]  }  return(c(y,needCorrect)[1])}> corrector("fof")[1] "for"

 

 

Reference:

http://norvig.com/spell-correct.html

http://www.sumsar.net/blog/2014/12/peter-norvigs-spell-checker-in-two-lines-of-r/

 

yant07

转载于:https://www.cnblogs.com/yant07/p/6291115.html

你可能感兴趣的文章
grid网格布局
查看>>
JSP常用标签
查看>>
九涯的第一次
查看>>
处理器管理与进程调度
查看>>
向量非零元素个数_向量范数详解+代码实现
查看>>
java if 用法详解_Java编程中的条件判断之if语句的用法详解
查看>>
matlab sin函数 fft,matlab的fft函数的使用教程
查看>>
mysql sin() 函数
查看>>
单片机复位电路
查看>>
php json_decode失败,返回null
查看>>
3-day3-list-truple-map.py
查看>>
Edit控件显示多行文字
查看>>
JS第二周
查看>>
dataTable.NET的search box每輸入一個字母進行一次檢索的問題
查看>>
Python 文件处理
查看>>
邻接表详解
查看>>
迭代dict的value
查看>>
eclipse package,source folder,folder区别及相互转换
查看>>
Py 可能是最全面的 python 字符串拼接总结(带注释版)
查看>>
《Java程序设计实验》 软件工程18-1,3 OO实验2
查看>>