SMALL Sab1 Real‑time event detection in social media streams through semantic analysis of noisy terms [Introduction] SMAFED라는 소셜 미디어 분석 프레임 워크 제안 용어, 약어 및 줄임말 등(=sab)의 단어 의미 분석 수행 이러한 단어의 어휘를 나타내는 통합 지식 베이스 생성 [Methodology] Data Input Layer python의 twitter api를 이용하여 데이터 수집 Pre-processing Layer 구두점, 반복문자 제거등의 데이터 정리 nltk를 통한 토큰화 및 정규화와 말뭉치를 사용하여 sab 추출 Data Enrichment Layer Naijalingo, Urban dictionary, Internet slang 세 가지를 활용하여 약 200만개의 sab 용어 정의와 예시를 포함한 통합지식베이스 생성 모호한 sab가 사용된 tweet과 지식베이스의 예시.. 2023. 12. 11. 이전 1 다음 LIST