이 책은 다른 자연어 처리 서적과는 다른 세 가지 특징이 있습니다. 첫째, 자연어 처리에 활용되는 개념적인 설명에서 끝나는 것이 아니라 모델 구현에 집중합니다. 둘째, 실무에서 자연어 처리 문제를 해결하는 데 도움이 되고자 감정분석부터 유사도 처리, 챗봇 그리고 버트와 GPT에서 할 수 있는 모든 하위 문제를 다룹니다. 셋째, 영어 데이터뿐만 아니라 한글 데이터를 활용한 문제 해결까지 다룹니다.
또한 두 차례의 개정을 통해, 다양한 자연어 처리 문제를 사전학습 모델인 버트와 GPT2를 통해 푸는 법과 GPT3에 대한 소개도 추가했습니다. 새롭게 추가된 8장까지의 모든 실습을 수행하고 나면 한층 더 높은 수준의 최신 자연어 처리 기법을 이해할 수 있습니다. 실습을 통해 자연어 처리를 다룰 자신감이 생겼다면 여러분은 이미 딥러닝 자연어 처리 전문가로서의 첫발을 내디딘 것입니다.
목차
▣ 01장: 들어가며 배경 이 책의 목표와 활용법 실습 환경 구축 __아나콘다 설치 __가상 환경 구성 __실습 프로젝트 구성 __pip 설치 __주피터 노트북 정리
▣ 02장: 자연어 처리 개발 준비 텐서플로 __tf.keras.layers __TensorFlow 2.0 사이킷런 __사이킷런을 이용한 데이터 분리 __사이킷런을 이용한 지도 학습 __사이킷런을 이용한 비지도 학습 __사이킷런을 이용한 특징 추출 __TfidfVecotorizer 자연어 토크나이징 도구 __영어 토크나이징 라이브러리 __한글 토크나이징 라이브러리 그 밖의 라이브러리(전처리) __넘파이 __판다스 __Matplotlib __맷플롯립 설치 __Matplotlib.pyplot __re 캐글 사용법 정리
▣ 03장: 자연어 처리 개요 단어 표현 텍스트 분류 __텍스트 분류의 예시 텍스트 유사도 자연어 생성 기계 이해 데이터 이해하기 정리
▣ 04장: 텍스트 분류 영어 텍스트 분류 __문제 소개 __데이터 분석 및 전처리 __모델링 소개 __회귀 모델 __TF-IDF를 활용한 모델 구현 __랜덤 포레스트 분류 모델 __순환 신경망 분류 모델 __합성곱 신경망 분류 모델 __마무리 한글 텍스트 분류 __문제 소개 __데이터 전처리 및 분석 __모델링 __참고 자료 정리
▣ 05장: 텍스트 유사도 문제 소개 데이터 분석과 전처리 __XG 부스트 텍스트 유사도 분석 모델 모델링 __CNN 텍스트 유사도 분석 모델 __MaLSTM 정리
▣ 06장: 챗봇 만들기 데이터 소개 데이터 분석 시퀀스 투 시퀀스 모델 __모델 소개 트랜스포머 모델 __모델 구현 정리
▣ 07장: 사전 학습 모델 버트 버트를 활용한 미세 조정 학습 __버트를 활용한 한국어 텍스트 분류 모델 __버트를 활용한 한국어 자연어 추론 모델 __버트를 활용한 한국어 개체명 인식 모델 __버트를 활용한 한국어 텍스트 유사도 모델 __버트를 활용한 한국어 기계 독해 모델 GPT __GPT1 __GPT2 GPT2를 활용한 미세 조정 학습 __GPT2를 활용한 한국어 언어 생성 모델 __GPT2를 활용한 한국어 텍스트 분류 모델 __GPT2를 활용한 한국어 자연어 추론 모델 __GPT2를 활용한 한국어 텍스트 유사도 모델 정리
▣ 08장: GPT3 GPT3 개요 퓨샷 러닝 퓨샷 러닝을 활용한 텍스트 분류 __퓨샷 러닝을 위한 네이버 영화 리뷰 모델 구성 __퓨샷 러닝을 위한 네이버 영화 리뷰 데이터 구성 __네이버 영화 리뷰 데이터를 활용한 퓨샷 러닝 및 평가 피-튜닝 __개요 __피-튜닝 방법론 __피-튜닝을 활용한 텍스트 분류 적용