QIURU CAI
School of Computer Engineering, Jiangsu University of Technology, Changzhou 213001, China(2020)
abstract :
도시 도로 사고의 주요 원인을 파악하기 위해서는 사고에 대한 통계에서 관련 위험 요긴간의 연관 규칙을 파악하는 것이 필요하며, 사고 데이터의 여러 계층과 차원을 고려하여 Apriori 알고리즘을 개선하여 요소 간의 연관규칙을 파악하고 교통 사고의 원인을 조사함.
introduction:
도시안에서의 교통 사고를 분석하는 수학적 방법은 크게 두 가지로 분류된다.
첫 번째는, 집계 방법으로 선형 회귀, 클러스터링, 시계열 등으로 나타낼 수 있으며, 이는 구현 방법이 간단하지만 정확도가 떨어지는 단점이 존재한다. 두 번째는, 분해 방법으로 베이지안 네트워크, 이산 선택 모델 등이 있으며, 이는 구현 방법이 어렵지만 정확하다.
하지만 이런 방법들은 통계적 방법으로 분석하기 때문에 다양한 위험 요인들을 고려할 수 없으며, 주요 사고 체인 또한 나타낼 수 없다. 그래서 본 논문에서는 Apriori알고리즘을 다차원 계층 데이터에 맞게 개선하여 분석을 수행한다.
method:
분석 수행단계는 다음과 같이 4단계로 이루어진다.
1. 데이터 전처리
2. 다차원 데이터 모델링
3. 알고리즘 수행
4. 연관규칙 보간 및 적용
Apriori 알고리즘으로 빈번 항목 집합을 계산하는데, 본래의 알고리즘은 1차원 데이터셋에서만 가능하기 때문에 이를 다차원 데이터에도 적합하게 개선한다.
방법은 분석 대상을 선택하는 것(?)이다. 즉, 2차원 속성 중 하나, 3차원 속성 중 하나를 선택하여 분석한다.
이를 support, confident, lift를 통해 적합성 척도로 사용한다.
이 세가지를 간단하게 설명하자면, 사건 A와 사건 B가 발생하였을 때,
- support(A→B) : 전체 사건 중 A와 B가 같이 나타날 확률 (즉, 합집합)
- confident(A→B) : 사건 A가 일어난 후에 B가 일어날 확률(조건부 확률)
- lift(A→B) : A와 B의 우연성을 가리는 척도(기준 1)
experiment:
사고의 형태와 종류, 원인에 대하여 분석을 수행하였을 때, support = 0.1, confident = 0.25, lift = 1로 수행하였다.
분석 결과, confident 가 떨어지는 결과가 3개가 보였기 때문에 0.4로 다시 분석을 수행하였다.
support는 드문 사고와 많이 일어나는 사고로 확실하게 나뉘었지만 사고 특성상 희귀한 사고도 판단해야하기 때문에 그대로 사용하였다.
분석 결과는 논문을 참고하시길.
discussion:
1. 연관 분석 특성상 희귀한 사건들은 분석이 어려움
2. 분석 결과를 확인한 결과, 눈에 띄게 보일만한 정보가 없음.
conclusion:
연관분석을 통해 도시의 교통사고의 원인과 결과를 분석함.
'PAPER' 카테고리의 다른 글
어텐션 기반 딥러닝 모델을 활용한 확장된 장보 정보 탐지 기법 연구 (0) | 2022.06.20 |
---|---|
Event classification and location prediction from tweets during disasters (0) | 2022.05.30 |
Road Traffic Event Detection Using Twitter Data,Machine Learning, and Apache Spark (0) | 2021.02.16 |
BusBeat: Early Event Detection with Real-Time Bus GPS Trajectories (0) | 2021.02.02 |
빅데이터처리 (0) | 2020.11.30 |