What do you want?80 Codility Distict https://codility.com/demo/results/demoTJHB47-7XW/ 중복값을 허용하는 숫자 배열에서 각각의 distict한 숫자의 개수가 몇개 인지 출력하는 문제.. 문제를 제대로 이해 못해서, 존재하지 않는 숫자를 출력하라는 줄 알았다.. NlogN의 시간복잡도를 가지니 해쉬를 이용해서 풀면 간단하다. 2014. 10. 25. Codility - Genomic-Range-Query https://codility.com/demo/results/demo7QVBHK-64R/ 문제의 요지는 입력되는 문자열, 각 인덱스 정보를 담고 있는 2가지의 배열 에대한 정보를 기초로 인덱스에 포함된 minimal impact factor들을 찾아 출력하라는 문제다. 풀이는 prefix count를 근간으로 풀이한 것으로서 먼저 string에 중복되는 글자의 카운트를 게놈배열에 저장한다. 그리고 인덱스배열의 각 인덱스를 빼와서 해당 인덱스가 게놈배열에서 문자가 포함됬다면 그중 가장 작은 문자 숫자를 찾아 출력한다. 여기서 작은 문자 숫자는 인덱스배열의 조합의 개수와 같다. 2014. 10. 25. Codility MinAvgTwoSlice https://codility.com/demo/results/demoDQH88X-9ZE/ 2014. 10. 23. Codibility PassingCars https://codility.com/demo/results/demo5FEXPG-ZE4/ 2014. 10. 23. Codility - MAX COUNTERS 입력 : N개의 Counters , 배열출력 : N 에 해당하는 카운터 배열 출력 https://codility.com/demo/results/demo7J72ME-SBG/ 2014. 10. 23. Hive + Python + VirtualEnv Hive + Python + VirtualEnvHive 쿼리에서 TRANSFORM, MAP/REDUCE 명령어를 사용하면 표준 입/출력을 통해 데이터를 처리할 수 있다.이걸 이용해 Python 스크립트로 데이터 처리를 해왔었는데 몇가지 귀찮은점이 있었다.모든 노드에 같은 버전의 파이썬을 설치해줘야 한다.모든 노드에 같은 파이썬 의존성 패키지를 설치해줘야 한다.모든 노드에 내가 작성한 파이썬 패키지를 배포해놓아야 한다.Hive의 ADD FILE 명령어와 VirtualEnv를 사용하면 이런 작업을 좀 더 간단하게 할 수 있다.위 스크립트는 url.txt에서 주소 하나를 가져와 requests 라이브러리를 사용해 데이터를 긁어와 반환하는 스크립트이다.특별한 의미는 없고 1. 스크립트가 사용하는 데이터 파일이 .. 2014. 9. 10. 이전 1 ··· 9 10 11 12 13 14 다음