본문 바로가기
SMALL

분류 전체보기138

데이터마이닝 R - 변수 선택 방법 실습 예제 변수 선택 방법 전진선택법(Forward Selection) 아무 변수가 없는 영모형 Y←1 에서 하나씩 변수를 추가해가면서 모형을 선택한다. 후진제거법(Backward Elimination) 유의하지 않은 변수가 많을지라도 p값을 기준으로 전체에서 1개씩 변수를 제거하여 모든 변수가 유의하며, 더 이상 제거할 변수가 없을 때까지 제거한다. 변수를 하나씩 제거하는 이유는 다중공성성(x1 변수 삭제 시, x2의 p값이 증가할 수 있음) 때문이다. 단계적선택법(Stepwise Selection) 모든 부분집합을 고려하는 방법으로 Best의 변수를 선택할 수 있으며, 전진 선택법과 후진 제거법의 장점을 더한 방법이므로 변수선택 방법 중 많이 사용하는 방법이다. mtcars의 dataset l AIC 통계량을 .. 2020. 5. 4.
MongoDB - sort(), limit(), skip() 이번 장에서 사용할 sample data 원본 - sort() 데이터를 정렬할 때 사용 매개변수로는 document를 전달하며 이 document는 어떤 key를 사용하여 정렬할지 알려주는 역할 KEY는 데이터의 field 이름이고, value의 값은 1(오름차순) 혹은 -1(내림차순) 또한 여러 KEY를 입력할 수 있으며, 먼저 입력한 KEY가 우선권을 가짐. ▶먼저 amount로 오름차순 정렬한 다음, amount의 값이 같은 것끼리 다시 item으로 내림차순 정렬◀ - limit( value ) 출력할 데이터 개수를 제한할 때 사용 Value 파라미터는 출력 할 개수 값을 나타냄 - skip( value ) 출력할 데이터의 시작부분을 설정할 때 사용 Valuer값 개수의 데이터를 생략하고 그 다음부.. 2020. 5. 4.
MONGODB - Document조회 ◎ find() - document를 조회하는 메소드 반환 값은 cursor. criteria에 해당하는 document들을 선택하여 cursor로 반환함. query 요청의 결과값을 가리키는 pointer. cursor객체를 통해 데이터의 수를 limit(제한)하거나 데이터를 sort(정렬)함. ※cursor란? 쿼리의 결과 집합에 대한 포인터. 라고 생각하면 될듯! 쉽게 말하자면 메모리 저장주소들의 값의 집합..정도,.. 되려나.. - find()함수 - pretty() 함수를 같이 썼을 때 나는 이것이 에러인 줄 알았으나... 4개 이하이거나 중첩된 문서가 아닐 경우에는 그냥 한줄로 나온다는..! 하나 더 배웠으니 되었다! (나쁜 pretty ㅜㅜ) ▶ query 옵션 비교(Comparison) 연.. 2020. 4. 26.
파일 속성 읽기 – Properties-reader Properties-reader는 파일내용을 읽어 ini형식으로 돌려준다. ini파일 형식이란 단순 구조의 텍스트 파일로 “.INI”라는 파일 확장자가 따라오지만 다른 확장자(".CFG", ".conf", ".TXT")를 사용하기도 한다. INI 파일에 포함된 기본 요소는 매개 변수이다. 각 변수는 이름과 값을 가지고 있으며 등호로 이를 구분한다. 이름은 등호 왼쪽에 적는다. 이 모듈은 실습으로 확인하는 것이 이해하기 쉬우므로 바로 실습 들어감! 다음과 같은 아무 파일(저는 txt파일로 실습했습니다.)을 읽어올 준비! 먼저 properties-reader를 사용하기 위해 npm을 사용하여 install 해줍니다. 명령어는 => npm install properties-reader 그리고 다음과 같이 명령.. 2020. 4. 23.
MONGODB-Database/Collection/Document 생성·제거와 Insert() ※ MongoDB 실행 - Mongo : 명령이 입력되는 셸 ( Mongod도 같이 실행) - Mongod : 데이터베이스의 호스트 프로세스 ( 백그라운드에서 실행) 실질적으로 명령을 처리하는 부분 ◆ Database RDBMS와 같은 개념 Collection들의 물리적인 컨테이너 (0개 이상의 Collection들의 집합으로 구성) - Database생성 : use DATABASE_NAME - 사용 중인 DB 확인 : db - DB리스트 확인 : show dbs (리스트에서 방금 만든 데이터베이스를 확인하려면 최소 한개의 document를 추가해야 함) -Database제거 : db.dropDatabase() → 제거하고 싶은 데이터베이스를 선택 후, 삭제 ◆ Collection RDBMS의 table.. 2020. 4. 23.
MONGODB-소개, 데이터모델 1. 소개 mongoDB는 C++로 작성된 오픈소스 문서지향(Document-Oriented)적 Cross-platform 데이터베이스 뛰어난 확장성과 성능을 자랑. 또한 현존하는 NoSQL 데이터베이스 중 인지도 1위를 유지 ※NoSQL이란? Not Only SQL, 기존의 RDBMS의 한계를 극복하기 위해 만들어진 새로운 형태의 데이터저장소 관계형 DB가 아니므로 RDBMS처럼 고정된 스키마 및 JOIN이 존재하지 않음 2. Document Oriented 데이터베이스 Document는 문서라는 의미이나, 단지 번역된 단어로서의 '문서'는 아니다. (통상적으로 사용하는 '한글', '워드' 등의 문서와는 다른 의미) RDBMS의 record와 비슷한 개념으로 데이터 구조는 한 개 이상의 key-valu.. 2020. 4. 22.
LIST