분류 전체보기

0. 시작 2024.08.11 - [[Deep daiv.] 복습] - [Deep daiv.] TIL - 4강. 지도 학습(분류) [Deep daiv.] TIL - 4강. 지도 학습(분류)0. 지도 학습 2024.08.09 - [[Deep daiv.] 복습] - [Deep daiv.] TIL - 3. 비지도 학습 세션 다시 시작'을 해주세요!sudo apt-get install -y fonts-nanum!sudo fc" data-og-host="hw-hk.tistory.com" data-og-source-url="https://hw-hk.tistory.com/hw-hk.tistory.com과 목표는 똑같습니다. 선수들의 데이터를 모아 포지션을 예측하는 문제입니다.이번에는 다양한 기법을 통해 해당 모델의 성..
1. k-NN 알고리즘 2024.03.19 - [머신러닝] - 머신러닝 공부 - 1 머신러닝에 대한 기본적인 이해와 KNN 알고리즘 머신러닝 공부 - 1 머신러닝에 대한 기본적인 이해와 KNN 알고리즘1. 분류와 회귀 머신러닝(Machine Learning) 은 크게 두 종류로 나타낼 수 있습니다. 분류(Classification) 회귀(Regression) 분류 (Classification) 는 미리 정의된 가능성 있는 여러 클래스 레이블 중 하나를 예측hw-hk.tistory.com2024.03.22 - [머신러닝] - 머신러닝 공부 - 2 KNN Regression and Linear Model 머신러닝 공부 - 2 KNN Regression and Linear Model1. K-NN Regress..
0. 지도 학습 2024.08.09 - [[Deep daiv.] 복습] - [Deep daiv.] TIL - 3. 비지도 학습 세션 다시 시작'을 해주세요!sudo apt-get install -y fonts-nanum!sudo fc" data-og-host="hw-hk.tistory.com" data-og-source-url="https://hw-hk.tistory.com/89" data-og-url="https://hw-hk.tistory.com/89" data-og-image="https://scrap.kakaocdn.net/dn/hhGln/hyWKARDMbL/D46TKtkskkvbDoJfs3G8Tk/img.png?width=800&height=410&face=0_0_800_410,https://s..
0. 텍스트 전처리 텍스트 전처리는 풀고자 하는 문제의 용도에 맞게 텍스트를 사전에 처리하는 작업입니다. 요리를 할 때 재료를 제대로 손질하지 않으면, 요리가 엉망이 되는 것처럼 텍스트에 제대로 전처리를 하지 않으면 뒤에서 배울 자연어 처리 기법들이 제대로 동작하지 않습니다. 1. 영어 처리 1.1 대소문자 통합 대소문자를 통합하지 않는다면 컴퓨터는 같은 단어를 다르게 받아들일 수 있습니다. 따라서 python 의 내장 함수 .lower() 와 .upper() 를 통해 간단하게 통합할 수 있습니다.s = 'AbCdEfGh'str_lower = s.lower()str_upper = s.upper()print(str_lower, str_upper)# abcdefgh ABCDEFGH 1.2 정규화 문자열에서 ..
1. PCA 주성분 분석 고차원의 데이터를 낮은 차원의 데이터로 바꿀 때, 어떻게 바꿔야 최대한 특징을 살리면서 차원을 낮출 수 있을까를 고안하다가 나온것이 PCA 입니다. 그렇다면 어떻게 해야 '잘' 차원을 축소시킬까? 2가지 방법이 있습니다. 1. 데이터들의 분산을 최대로 하는 축을 기준2. 데이터들의 정사영의 축을 기준 이 두 가지 방법 모두 같은 결과를 나타냅니다. 수학적으로는 다음과 같은 순서를 통해 얻을 수 있습니다. 1. N차원의 데이터로부터 Covariance Matrix 를 생성합니다.2. 생성된 covariance matrix 에서 N 개의 Eigenvector, Eigenvalue 를 찾습니다.3. 찾은 Eigenvector 를 Eigenvalue 가 큰 순서대로 정렬합니다.4. 줄이..
0. 기본 세팅 우선 한글 폰트를 설치하고, seaborn 에 한글 폰트를 설정을 해야합니다.# 한글 폰트 설치# 이 셀을 실행시키고 '런타임 > 세션 다시 시작'을 해주세요!sudo apt-get install -y fonts-nanum!sudo fc-cache -fv!rm ~/.cache/matplotlib -rfimport matplotlib.pyplot as pltimport seaborn as sns# 한글 폰트 설정sns.set_theme(font ='NanumGothic', rc = {'axes.unicode_minus' : False}, style ='whitegrid')# 샘플 플롯 생성plt.figure(figsize=(8, 6))plt.plot([-2, -..
1. Selenium Selenium 은 웹을 동작시키는 하나의 도구입니다. Selenium 패키지가 자주 업데이트 되기 때문에 Selenium 을 설치하는 방법은 매번 달라집니다. 우선 Colab 환경에서 Selenium 을 설치하는 방법입니다.from google.colab import drivedrive.mount('/content/drive')!pip install selenium!apt-get update!apt install chromium-chromedriver# !cp /usr/lib/chromium-browser/chromedriver '/content/drive/MyDrive/Colab Notebooks' # (최초 1회)!pip install chromedriver-autoinstal..
1. 웹 크롤링 크롤링? 스크래핑? 웹 크롤링은 인터넷 상에 존재하는 모든 웹 페이지를 방문하며 데이터를 수집하는 방법입니다. 크롤링은 대부분의 검색 엔진에서 사용되며(* Page Rank) 이를 통해 인덱싱 작업을 수행합니다. 스크래핑과 가장 큰 차이점은 특정한 웹 페이지가 아닌 URL 을 타고 다니며 반복적으로 데이터를 가져오는 과정이 진행된다는 점 입니다. 웹 스크래핑은 특정한 웹 사이트에서 필요한 데이터를 수집하는 방법입니다. 스크래핑은 크롤링보다는 좁은 범위에서 데이터 수집에 주로 사용됩니다. 예를 들어, 온라인 쇼핑몰에서 상품 정보를 추출하거나, 뉴스 사이트에서 최신 기사를 수집하는 등의 작업을 수행할 때 주로 사용됩니다. 크롤링에 비해 스크래핑은 특정한 웹 사이트에서 필요한 데이터를 추출하는..
건대다니는 컴공생
'분류 전체보기' 카테고리의 글 목록 (18 Page)