#keywords ì •ê·œ 표현ì‹,한글 || [http://blog.jinbo.net/zeniroy/?pid=41] || ''' 2. 한글 추출 ''' ì´ ë¶€ë¶„ì´ ì°¸ 아스트랄 í•œë°.. 한번 ë³´ìž.. {{{#!vim cpp string jamo = "[\\x{3131}-\\x{318E}]"; string syllable = "[\\x{AC00}-\\x{D7A3}]"; string not_syllable = "[^\\x{AC00}-\\x{D7A3}]"; string paren = "\""; string not_paren_all = "[^"+paren+"]*"; string const_str = paren + not_paren_all + syllable + not_paren_all + paren; string const_str2 = paren + not_paren_all + not_syllable + not_paren_all + paren; }}} ì¼ë‹¨ ìœ„ì˜ 4가지는 준비 ë‹¨ê³„ì— í•´ë‹¹í•˜ëŠ” 것ì´ë‹¤. ìžìŒëª¨ìŒì€ unicodeì—ì„œ 0x3131 ~ 0x318E 까지 ì´ë‹¤. ì´ë¥¼ stringì— ë„£ê¸° 위해서는 ê¼ \ê°€ 2ê°œ 들어가야 한다는 사실!! 안그러면 ì—러나요~;;; ìŒì ˆì€ 0xAC00 ~ 0xD7A3 까지 ì´ë‹¤. parenê³¼ not_paren_allì€ ìš°ë¦¬ê°€ 프로그램ì—ì„œ 보통 stringì„ "ë¡œ 묶어서 ì“°ê¸°ë•Œë¬¸ì— ë“¤ì–´ê°€ 있는 것ì´ë‹¤. 첫번째 const_strì€ "...한글..." ê³¼ matchë˜ëŠ” regular expressionì´ë‹¤ 하지만 ê·¸ë ‡ì§€ 않다는 ê±°!!! regexì—서만 그런지 아님 다른 ê³³ì—ì„œë„ ê·¸ëŸ°ì§€ ëª¨ë¥´ê² ì§€ë§Œ.. ì´ê²ƒì€ í•œê¸€ì´ ì•„ë‹Œ 것들만 ì«™ 골ë¼ë‚´ê²Œ ëœë‹¤;; 그래서 내린 íŠ¹ë‹¨ì˜ ì¡°ì¹˜ê°€ 바로 const_str2ì´ë‹¤ ì´ê²ƒì€ 사실 "...한글 ì•„ë‹Œ 것..."ê³¼ matchë˜ì–´ì•¼ 하지만.. 바로 ì´ê²ƒì´ "... 한글..."ê³¼ matchë˜ëŠ” ê²ƒì´ ì•„ë‹Œê°€.. 여기 ì €ê¸° 찾아보았지만 ë§Œì¡±í• ë§Œí•œ ëŒ€ë‹µì„ ë³´ì§€ 못했다.. 혹 누가 ì•„ì‹ ë‹¤ë©´ ì•Œë ¤ì£¼ì„¸ìš”..ã…œ.ã…œ