공부일지

  • 홈
  • 태그
  • 방명록

바이트 페어 토크나이저 1

[자연어처리] 바이트 페어 인코딩(Byte Pair Encoding, BPE)

바이트 페어 인코딩(Byte Pair Encoding, BPE) 💡 BPE(Byte Pair Encoding)란? "Byte Pair Encoding(BPE)"은 '바이트 쌍 인코딩'으로 직역되며, 이는 단어나 문자열에서 연속된 바이트 쌍을 찾아내어 하나의 새로운 토큰으로 결합하는 방식을 의미합니다. 이 알고리즘은 주어진 데이터에서 자주 등장하는 바이트 쌍을 기반으로 새로운 토큰을 만들어내어 데이터를 효율적으로 표현하고 토큰화하는 데 사용됩니다. 📢 여기서 OOV란? 기계는 문제를 풀 때 모르는 단어가 나오면 주어진 문제를 풀기 어려워지는데, 이러한 상황을 OOV(Out-Of-Vocabulary)라고 합니다. OOV는 학습되지 않은 단어가 들어온 상황을 나타내며, 이를 완화하기 위해 Subword Tok..

자연어처리/이론 2024.01.21
이전
1
다음
더보기
프로필사진

공부일지

  • 분류 전체보기 (41)
    • 논문리뷰 (1)
    • 파이썬 (11)
      • 기본문법 (1)
      • 코딩테스트 (10)
    • 머신러닝&딥러닝 (17)
      • 이론 (10)
      • 실습 (1)
      • 과제 (1)
    • 자연어처리 (1)
      • 이론 (1)
      • 실습 (0)
    • OCR & 컴퓨터비전 (1)
      • 이론 (1)
      • 실습 (0)
    • 웹개발 (2)
      • HTML (1)
      • CSS (0)
      • JavaScript (0)
      • Node.js (1)
    • Git & Git Hub (1)
    • 프로젝트 (2)
    • 스터디 (4)
    • 오류해결 (1)

Tag

컴퓨터비전, 평가지표, 아다그라드, 최소 제곱법, 파이썬, 파이썬기초, 앙상블, 선형회귀, 지도학습, 파이토치, 비선형활성화함수, 사이킷런, 프로젝트, 백준, 딥러닝, 머신러닝, 바이트 페어 토크나이저, 코딩테스트, 수어번역, 투포인터,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바