파이썬(Python) - 데이터 처리에 대해서
오늘은 파이썬 람다식 및 Map 함수에 대해서 설명드리겠습니다.
요즘 한참 파이썬을 활용해서 필드에서 빅데이터 처리 및 여러 알고리즘을 활용해서 학습 후 데이터
모델링을 만드는 업무에 매진 중에 있습니다.
데이터를 핸들링하는 프로젝트에서 무엇보다 중요한 것은 데이터를 처리하는 기반기술에 대한 이해 및
낮은COST(비용)으로 원하는 데이터 셋을 만드는 일련의 프로세스 즉, 데이터 전처리 과정에 많은 시간이
할애되는 것을 몸으로 체감하고 있습니다.
파이썬이 데이터 과학 분야에서 필두로 쓰이는 언어만큼 이번 포스팅 부터는 2회에 걸쳐서 람다식(lambda)
및 기본 예제를 설명드리려고 합니다.
기본에 충실할 때 단순한 코드로 원하는 데이터를 파싱해서 적합한 모델로 만들 수 있다는 것과 적합한
분석 결과/인사이트 도출 및 완성된 모델 성능에 영향을 미친다고 생각합니다.
그러면 문서 하단에서 간단하게 예제를 작성해보겠습니다.
파이썬(Python) 데이터 처리 - 람다식 및 map 함수 예제 코드
파이썬 람다식을 활용하면 데이터를 다루는 부분에 있어서는 타 언어와 다르게 매우 쉽고 직관적인 코드로
다양한 형식의 데이터를 변형 및 가공할 수 있다.
lambda_example1.py
12345678910111213141516171819202122232425262728293031 import time #시작시간start_time = time.time() if __name__ == '__main__': testArr1 = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] testArr2 = [2, 4, 6, 8, 10, 12, 14, 16, 18, 20] #lambda 사용법 : 매개변수1, 매개변수2, 매개변수X...: 출력식1 if 조건문 else 출력식2 #if 조건식 사용할 경우 반드시 else 문 사용해야 한다. #람다 예제1 outArr1 = list(map(lambda x: 'OK' if x % 2 == 0 else x, testArr1)) print('Lambda Example1 : ', outArr1) #람다 예제2 #다중 조건식은 코드의 가독성이 현저하게 떨어지므로, 되도록 함수로 분리 outArr2 = list(map(lambda x: 'First' if x == 1 else 'Second' if x == 2 else x * x, testArr1)) print('Lambda Example2 : ', outArr2) #람다 예제3 #다중 매개변수 map + 람다식 활용 outArr3 = list(map(lambda x, y: x + y, testArr1, testArr2)) print('Lambda Example3 : ', outArr3) #종료시간print("--- %s seconds ---" % (time.time() - start_time)) cs
- 16번 라인 : if-else 구문을 활용한 기본 람다식 예제
- 21번 라인 : 다중 if-else 구문을 활용한 람다식 예제
- 26번 라인 : 다중 매개변수를 활용한 람다식 예제- 17, 21, 27 라인 : 출력 결과는 하단의 이미지 또는 첨부파일 별도 실행 참조
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 | import time #시작시간 start_time = time.time() if __name__ == '__main__': testArr1 = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] testArr2 = [2, 4, 6, 8, 10, 12, 14, 16, 18, 20] #lambda 사용법 : 매개변수1, 매개변수2, 매개변수X...: 출력식1 if 조건문 else 출력식2 #if 조건식 사용할 경우 반드시 else 문 사용해야 한다. #람다 예제1 outArr1 = list(map(lambda x: 'OK' if x % 2 == 0 else x, testArr1)) print('Lambda Example1 : ', outArr1) #람다 예제2 #다중 조건식은 코드의 가독성이 현저하게 떨어지므로, 되도록 함수로 분리 outArr2 = list(map(lambda x: 'First' if x == 1 else 'Second' if x == 2 else x * x, testArr1)) print('Lambda Example2 : ', outArr2) #람다 예제3 #다중 매개변수 map + 람다식 활용 outArr3 = list(map(lambda x, y: x + y, testArr1, testArr2)) print('Lambda Example3 : ', outArr3) #종료시간 print("--- %s seconds ---" % (time.time() - start_time)) | cs |
- 16번 라인 : if-else 구문을 활용한 기본 람다식 예제
- 21번 라인 : 다중 if-else 구문을 활용한 람다식 예제
- 26번 라인 : 다중 매개변수를 활용한 람다식 예제
파이썬(Python) 데이터 처리 - 람다식 예제 실행 화면
아래 이미지로 실제 실행 화면을 확인하실 수 있습니다.
실제 실행 화면
마무리
이번 포스팅에서는 첫 번째 시간으로 본격적인 데이터 전처리 관련 포스팅에 앞서서 간단한 람다식 활용
예제를 다루는 설명을 드렸습니다.
데이터 분석가의 설문조사에 따르면 프로젝트 진행 프로세스 거의 80% 이상의 육박하는 리소스를 데이터
전처리/가공 과정에 할애 한다고 합니다.
데이터 분석/기술 전문가를 위해서는 데이터를 보는 안목도 중요하지만, 데이터를 처리하는 전반적인
제반기술에 대해서도 반드시 학습을 필요로 하는 것 같습니다.
다음 시간에는 람다식을 활용해서 파이썬의 Filter, Reduce 함수를 활용하는 예제를 다뤄보도록 하겠습니다.
소스코드 다운로드 : py_map_example1.zip
'언어 > Python' 카테고리의 다른 글
파이썬(Python) - 데코레이터 (Decorator) 패턴 사용 예제 및 소스코드 (0) | 2018.12.10 |
---|---|
파이썬(Python) - 람다(lambda)식 및 filter, reduce 사용 예제 및 소스코드 (0) | 2018.11.15 |
파이썬(Python) - 정규표현식(Regex) 특수문자 제거 설명 및 예제 소스 코드 (3) | 2018.07.20 |
파이썬(Python) - multiprocessing(멀티프로세싱) 설명 및 예제(2) - Process (4) | 2018.06.12 |
파이썬(Python) - multiprocessing(멀티프로세싱) 설명 및 예제(1) - Pool (4) | 2018.05.31 |