php_mecabで複合名詞を取り出すサンプルコード

単純に名詞が連続したら一つにまとめて取り出しています

サンプルコード
—————————————————————————–
parseToNode($txt); $node; $node=$node->getNext()){
if($node->getStat() != 2 && $node->getStat() != 3 && mb_strpos($node->getFeature(), ‘名詞’, NULL, ‘utf-8’)===0){
$word .= $node->getSurface();
} else if ($word != ”) {
array_push($meisi, $word); //渡された変数をarrayの最後に加える
$word = ”;
}
}

//最後が名詞で終わった場合用の追加処理。
if ($word != ”) array_push($meisi, $word);
//名詞の重複削除
$meisi = array_unique($meisi);

print(“

");
print_r($meisi);
print("

“);
?>
—————————————————————————–

タイトルとURLをコピーしました