건강ㅣ생활ㅣ시사용어
건강상식ㅣ생활상식ㅣ시사용어 통합게시판입니다.
임배딩(embedding)
|
임배딩(embedding)
사람이 쓰는 자연어를 기계가 이해할 수 있는 숫자의 나열인 벡터(vector)로 바꾼 결과 혹은 그 과정 전체를 가리켜 임배딩(embedding)이라고
한다. 자연어 처리에서 사용되는 용어다.
임배딩(embedding)이란 단어나 문장, 문서를
벡터(vector)로 변환시킨 값이나 그 과정을 말하며 이렇게 변환시킨 벡터 값에 의미와 정보를 손실없이
잘 담아낼수록 좋은 임배딩(embedding)이라 할 수 있고 임베딩의 방법은 여러 가지가 존재한다.
2010년대 초반부터 컴퓨터에서 단어의 의미를 표현할 때 사용한 방법은 고차원 공간의 각 좌표에, 해당
공간에서의 근접성이 의미론적 유사성을 반영하도록 단어들을 할당하는 것이었다. 이러한 방식을 사용하면
텍스트의 심화 분석에 큰 도움이 되지만, 각 단어의 좌표를 구해야 하는 문제가 발생한다. 이 절차를 임배딩(embedding)이라고 한다.
† 성부와 성자와 성령의 이름으로 아멘.
|