ljsking / PatternSearch

5 stars 1 forks source link

영어 여러문장일 경우. #9

Closed ljsking closed 15 years ago

ljsking commented 15 years ago

한문장으로만 할 것인가?

ljsking commented 15 years ago

>> require "stanfordparser"
=> true
>> preproc = StanfordParser::DocumentPreprocessor.new
=> 
>> puts preproc.getSentencesFromString("This is a sentence.  So is this.")
This is a sentence .
So is this .
ljsking commented 15 years ago

영어는 한문장으로 나누지만 한글은 아직 나누지 않는닷!

ljsking commented 15 years ago

문장을 나눌 경우 버그가 있음. 일단은 포기

ljsking commented 15 years ago

현재 여러 문장인 영어를 tagger에 넣으면 일단 한문장으로 가정하고 파싱하기 때문에 제대로된 결과가 안나옴.

ljsking commented 15 years ago

preproc.getSentencesFromString 는 어레이의 어레이다. 최상위의 어레이는 문장 어레이를 가지고 있으며 문장 어레이는 edu.stanford.nlp.ling.Word를 가지고 있다.