六狼论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博账号登陆

只需一步,快速开始

搜索
查看: 714|回复: 0

分享一个PHP中文分词,一定要看(13亿人看完都感动了^_^!!!)

[复制链接]
 楼主| 发表于 2014-12-2 16:43:48 | 显示全部楼层 |阅读模式
分享一个PHP中文分词,一定要看(13亿人看完都感动了^_^!!!)
  1. <?php

  2. /**
  3. * 中文分词处理方法
  4. *+---------------------------------
  5. * @param stirng  $string 要处理的字符串
  6. * @param boolers $sort=false 根据value进行倒序
  7. * @param Numbers $top=0 返回指定数量,默认返回全部
  8. *+---------------------------------
  9. * @return void
  10. */
  11. function scws($text, $top = 5, $return_array = false, $sep = ',') {
  12.     include('./pscws4/pscws4.php');//去下面给的网址把pscws4下载下来
  13.     $cws = new pscws4('utf-8');
  14.     $cws -> set_charset('utf-8');
  15.     $cws -> set_dict('./pscws4/etc/dict.utf8.xdb');
  16.     $cws -> set_rule('./pscws4/etc/rules.utf8.ini');
  17.     //$cws->set_multi(3);
  18.     $cws -> set_ignore(true);
  19.     //$cws->set_debug(true);
  20.     //$cws->set_duality(true);
  21.     $cws -> send_text($text);
  22.     $ret = $cws -> get_tops($top, 'r,v,p');
  23.     $result = null;
  24.     foreach ($ret as $value) {
  25.         if (false === $return_array) {
  26.             $result .= $sep . $value['word'];
  27.         } else {
  28.             $result[] = $value['word'];
  29.         }
  30.     }
  31.     return false === $return_array ? substr($result, 1) : $result;
  32. }
  33. print_r(scws('青花夔龙纹香炉'));
复制代码
scws网址:http://www.xunsearch.com/scws/
pscws4下载:http://download.csdn.net/detail/pzp_118/5412639

分享一个PHP中文分词,一定要看(13亿人看完都感动了^_^!!!)
摘自:http://blog.csdn.net/pzp_118/article/details/8949192
该会员没有填写今日想说内容.
您需要登录后才可以回帖 登录 | 立即注册 新浪微博账号登陆

本版积分规则

快速回复 返回顶部 返回列表