SMALL 전체 글142 연구실 프린터 '용지 부족' 오류 해결(hp 프린터) 컴퓨터 껐다 켜보기 --> 실패 프린터 껐다 켜보기 --> 실패 공식 홈페이지에 나온 방법들 (전원 꺼보기, 프린터 청소 등등..) --> 실패 내 컴퓨터에 '컴퓨터 관리'를 검색 ->서비스 및 응용프로그램 -> 서비스 -> 'p' 입력 -> print spooler 선택 -> 중지 -> 시작 !!해결!! 2020. 7. 23. 데이터마이닝 R - Random Forest 랜덤포레스트(Random Forest)는 배깅(Bagging)에 랜덤과정을 추가한 것이다. 배깅(Bagging)이란? 원 데이터 집합으로부터 크기가 같은 표본을 여러 번 단순임의 복원추출하여 각 표본에 대해 분류기 (classifiers)를 생성한 후 그 결과를 앙상블 하는 방법 반복추출방법을 사용하기 때문에 같은 데이터가 한 표본에 여러번 추출될 수도 잇고, 어떤 데이터는 추출되지 않을 수도 있음 이러한 방법을 사용하여 랜덤포레스트는 예측변수들을 임의로 추출하고, 추출된 변수 내에서 최적의 분할을 만들어 나가는 방법이다. 새로운 자료에 대한 예측을 수행할 때, 분류의 경우에는 다수결로 선택하고 회귀의 경우에는 평균을 취하는 방법을 사용하며 이는 다른 앙상블 모형과 동일하다. 다음 실습으로 BostonH.. 2020. 6. 25. 컴퓨터의 데이터 컴퓨터상의 데이터는 두 종류가 있다. 정적 데이터 동적 데이터 정적 데이터는 변경 비율이 적은 데이터를 말하며 반대로 동적 데이터는 변경 비율이 높음을 뜻한다. 이 둘을 비교한 표는 다음과 같다. 그러므로 정적 데이터는 속도보다는 정확도가 핵심이며, 잘 저장하는 것에 집중하여야 한다. 반대로 동적 데이터는 속도가 중요하기 때문에 빠르게 저장하는 것이 핵심이다. 컴퓨터 연산에는 위의 표에 나와있듯이 READ와 WRITE가 있다. 여기서 WRITE는 삽입, 변경, 삭제를 포함하고, READ는 단지 데이터를 읽는 것을 말한다. 이제 컴퓨터가 데이터를 저장할 때 어떻게 처리를 하는 지 알아보자. 먼저 컴퓨터는 자신이 가지고 있는 공간을 기억하고 있는데, 사용 중인 공간과 빈 공간을 따로 저장한다. 예를 들어, .. 2020. 6. 23. Pregel-A System for Large-Scale Graph Processing(2010) 그래프 프로세싱 하는 것에 대한 문제점으로는 다음과 같이 두 개가 있다. 1.Poor locality of memory access - Distributed memory requires that the edges and vertices of a graph be partitioned among processors. 2.Very little work per vertex 이는 그래프가 메모리에 접근하는 것이 좋지 않으며, vertex당 처리하는 양이 적다는 것을 뜻한다.(?) 그래서 이를 해결하기 위한 해결책이 다음과 같이 4가지가 있다. 1.Crafting a custom distributed infrastructure ⇒ typically requiring a substantial implementatio.. 2020. 6. 19. orientDB - 클러스터오류 The record with id '#78:12086' was not found DB name="pokec" DB name="pokec" at child.Operation.parseError 다음과 같은 에러와... (db=14,your=15) 어쩌구... 와 같은 버전이 안맞다는 에러로 한 3일간 고생한듯....ㅜㅜ 그래서 commit과 cascade를 위주로 찾아보았다.... 안된다... 자꾸 없는 함수랜다....ㅜㅜㅜ 결국 찾은 해결방법은...!! "import할 때 클러스터를 잘못 지정해줘서" 이다 ㅠㅠ 말도안돼 ㅠㅜㅠㅠㅠㅠㅠㅠㅠㅠ 저 클러스터...! 나는 3개를 쓰고있는데 1로 해놨다가 못찾아서 나는 에러였음... 진짜 바보같은 실수로 3일을 날렸.... 다신 그러지말자고 기록남긴다...휴..... 2020. 6. 1. 데이터마이닝 R - Neural Network 실습 1. R을 이용하여 0< x 2020. 5. 24. OrientDB - 클러스터 오류 발생하던 오류를 캡쳐하는 걸 까먹었다.... 이런... 무튼 클러스터? 문제였는데 orient 초보자인 나는 서버만 클러스터를 하면 데이터베이스는 물론 클래스도 알아서 클러스터가 되는 줄 알았다... 그래서 클러스터를 하겠다고 설정해놓은 클래스에 js query를 사용하여 create vertex를 하려고 하니 자꾸 에러가 떴다. ㅜㅜ 그것도 엄청 다양한 에러가 ㅠㅠ 대충 기록해논 것을 보면 1. Error deserializing record with id #38:2468 send this data for debugging: ABhQcm9maWxlX0luZm+5AQAAAEO1AQAAAEi3AQAAAEzDAQAAAFAIUGlkMQAAAFwHvQEAAABouwEAAAB3vwEAAACIAAhtYWxlBkhz.. 2020. 5. 20. 데이터마이닝 R - Naive bayes classification 실습 1. spam data를 이용하여 분류 모델을 만들고 결과 해석(비복원추출방법 사용) spam의 data를 사용하려면 library "kernlab" 을 install 해줘야한다. (명심!) spam dataset은 총 4601개의 이메일에서 등장하는 단어의 종류와 관련된 58개의 변수로 구성이 되어있다. 여기서 마지막 type은 스팸인지 아닌지를 구별하는 변수로 이 변수를 통하여 분류 모델을 구성할 것이다. library "klaR"을 사용하기 위해 먼저 install 해주고, 비복원추출로 분석하며 데이터의 70%를 train data로, 나머지를 test data로 사용한다. 4601개의 데이터이기 때문에 3220개의 데이터를 train 데이터로 지정해주었다. model1이라는 변수에 학습된 Naïv.. 2020. 5. 18. MONGODB - update() · update() 앞서 insert, find, remove를 통해 데이터를 추가, 확인, 삭제를 할 수 있었다면, Document의 field를 수정하는 기능도 필요 field를 수정하는 메소드가 update() 이번에도 이론보다는 실습으로 해보자. 이번 실습을 도와줄 데이터. 1. field 정보 업데이트와 document 대체 · name field가 eungi(은지)인 document의 height field값을 168로 수정하고 싶다. → 특정 field 값을 수정할 때는 '$set' 연산자를 사용한다. → '$set'연산자를 사용하지 않을 시에는 document 자체가 대체된다. 2. 특정 field 제거 · name field가 dongho인 document의 grade field를 제거하.. 2020. 5. 7. 이전 1 ··· 12 13 14 15 16 다음