안녕하세요.
노잡앤잡 파파켁입니다.
지난번 데이터라벨러 관련 글을 업로드 하고 해당 교육을 받아볼까하여 등록을 완료하고 기본 교육을 수강했습니다.
https://nojobnjob.tistory.com/56
1차 수업은 데이터라벨링 기본교육이 진행되네요.
아마도 추후부터는 다른 블로그에서 확인한 결과 1차 교육에서 언급된 내용들을 직접 훈련하는 내용이 진행 된다고 하는데 그럼 어떤 내용을 배웠는지 간략히 소개하겠습니다.
< 데이터 라벨링 Process >
위의 그림과 같이 데이터 라벨링을 하기전에
수집-> 정제의 단계를 거칩니다.
그리고 라벨링의 과정에서
1. 이미지
2. 동영상
3. 텍스트
4. 오디오
로 구분을 하게됩니다. 각 요소별로 중복되는 라벨링 기법들도 존재하며 해당 요소의 특징적인 부분들에 따라 라벨링 기법이 달라집니다.
데이터 라벨링 방법
라벨링 방법을 간단히 정리해봤는데 구체적인 내용은 이렇습니다.
1. 이미지
1) 바운딩: 바운딩은 Bounding box 라고 말하듯이 이미지자료 대상에 box를 쳐서 이미지에 라벨링 하며 하나의 이미지에 2가지 대상물이 있을 경우는 태깅을 통해 2가지 대상물을 식별 가능하도록 합니다.
2)감정분석: 인물의 사진이나 동물의 사진 등에서 해당 감정을 알 수 있는 부분(사람은 얼굴, 동물은 얼굴, 꼬리 등)을 체크하여 해당 감정을 태깅 또는 묘사하여 라벨링 합니다.
3)얼굴랜드마크: 얼굴 주요부위(눈, 코, 입 등)를 점으로 표시하여 구분하여 라벨링
4)OCR: 인간의 글을 이해하기 위해 글자 바운딩, 태깅, 전사 등을 통하여 라벨링
5)폴리곤: 작업 대상의 외곽선에 점으로 표시하여 라벨링하는 방법
6)폴리라인: 작업 대상의 외곽선에 점으로 표시하여 라벨링하는 방법. 폴리곤과 비슷한 방법이나 폴리곤은 시작점과 끝점이 연결되는 도형 형태의 사물에 주로 적용이 되고, 폴리라인은 선의 형태로 이루어져 시작점과 끝 점이 만나지 않는 다는 점이 특징이다.
2. 동영상
1)바운딩: 이미지와 동일한 의미
2)스켈레톤 추출: 특정행동을 분석하기 위해 영상에서 특정행동들을 태깅하여 라벨링
3)특정구간 추출: 스켈레톤과 비슷하나 이것은 운동경기 등의 특정한 구간(축구로 치면, 슛, 골)을 태깅하여 라벨링
4)시멘틱세그멘티에션: 폴리곤, 폴리랄인, 브러쉬 등을 사용하여 경게를 나누어분할함으로써 이미지나 영상 내의 모든 대상의 위치 및 모양을 영역으로 분류해내는 기법
4)-1. 3D라벨링: 육면체의 입체적인 박스를 생성하여 바운딩 하는 것과 같이 2차원 라벨링의 한계를 넘어 3차원의 입체적 표현을 가능케 하는 라벨링 기법
4)-2. 멘티모달라벨링
3. 텍스트
언어모델로 인터넷자동완성, 연관검색어, 챗봇 서비스등에 이용
1)문장의 의미 비교: 주어진 문장들의 의미가 같은 것인지 태깅
2)감정 태깅: 제시된 글을 읽었을 때 느껴지는 감정을 선택하는 라벨링
3)키워드 찾기: 대화 내용 속에서 핵심이 되는 키워드를 찾는 것
4)문장요약: 글을 읽고 핵심이 되는 내용을 요약하는 것
4. 음성
상황별 맞춤대화, 음성인식, 자동번역, 자막등에 이용
1)화자구분: 음성을 듣고 화자가 어른인지, 어린인지, 노인인지, 여자인지 남자인지 등을 구분
2)음성받아쓰기: 일반전사, 이중 전사 등의 방법을 이용하여 음성을 텍스트로 변환하는 것
*해당내용은 문제시 삭제하도록 하겠습니다.
*모든 내용은 제가 공부하고 작성하였습니다. 돈 받고 작성된 내용은 아님을 알려드립니다.
'재테크,주식,부동산,n잡러,파이프라인' 카테고리의 다른 글
09.26. 뉴스 헤드라인 및 관련주 (57) | 2023.09.26 |
---|---|
09.25. 주요 뉴스 및 개장전 주요헤드라인(feat. newflow) (94) | 2023.09.25 |
09.22. 주요뉴스 및 관련주(정치테마 이슈 클듯, feat. 센티) (7) | 2023.09.22 |
09.21. 한경 마켓프로 칼럼. 난도 높아진 자산시장....'사모대출' 투자로 눈 돌려라 (4) | 2023.09.21 |
09.21. 주요 신문 헤드라인 (5) | 2023.09.21 |