DSc_Veritas+ 기반 자동 카테고리 추천 안내 > 공지사항

DSc_Veritas+ 기반 자동 카테고리 추천 안내

본문


서비스 안내


DSc는 사용자가 작성한 글의 제목과 본문을 실시간 분석해 가장 적합한 카테고리를 추천하는 AI 기반 분류 시스템, 

DSc_Veritas+를 도입했습니다. 간편하게 카테고리를 확인할 수 있으며, 필요 시 근거를 확인할 수 있습니다.

(DSc_Veritas+는 콘텐츠 추천 서비스에 활용될 예정입니다.)



어떤 카테고리가 있나요?

뉴스
정치
경제·금융
국제
사회
법률·행정
재난·안전
노동·고용
교육·입시
취업·커리어
IT·과학·기술
비즈니스·창업
스타트업·테크비즈
투자·재테크
부동산
의료·건강
환경·기후
지역·로컬
생활·라이프
문화·예술
영화·영상
음악
게임
스포츠
여행
음식·요리
패션·뷰티
자동차·모빌리티
디자인·사진
취미·레저
반려동물
인문·철학
종교
문학
엔터테인먼트
일상·잡담




어떤 방식으로 작동하나요?

기본 작동:

텍스트 분석: 글의 제목과 본문을 종합적으로 분석합니다
패턴 인식: 과거 학습 데이터를 바탕으로 텍스트의 특성과 패턴을 파악합니다
통계적 추론: 수많은 데이터로부터 학습한 언어적 특징을 활용해 카테고리를 예측합니다
지속적 개선: 사용자 피드백을 통해 분류 정확도를 계속 향상시킵니다
편향 보정: 특정 카테고리(예: 활발한 커뮤니티 분야)에 학습 데이터가 치우쳐 있을 경우, 해당 과대 대표성을 자동으로 감지하고 보정해 공정성을 높입니다.
정확도 가중합: 단순 점수만이 아니라, 각 카테고리의 모델 정확도(학습 성능 및 신뢰도, 가중치)를 함께 반영하여 최종 선택 점수를 계산합니다.
지속적 개선: 사용자 및 여러 종류의 llm 모델의 피드백(수동 수정·정답 표기 등)을 받아 학습 통계를 갱신하고 분류 성능을 지속 개선합니다.



분류 과정

전처리: 불필요한 요소를 제거하고 핵심 내용만 추출

단어 분석: 주요 키워드와 문맥을 파악

가중치 계산: 제목은 본문보다 높은 중요도로 처리

편향 보정: 데이터가 특정 분야에 치우치지 않도록 자동 조정

신뢰도 반영: 카테고리별 정확도를 함께 고려해 점수를 보정

최종 결정: 가장 높은 점수의 카테고리를 추천



데이터 분류 및 학습에 사용된 llm 모델

openai/gpt-oss-120b
qwen/qwen3-32b
deepseek-r1-distill-llama-70b
llama-3.3-70b-versatile
meta-llama/llama-4-maverick-17b-128e-instruct
meta-llama/llama-4-scout-17b-16e-instruct
openai/gpt-oss-20b
gemma2-9b-it
meta-llama/llama-guard-4-12b
moonshotai/kimi-k2-instruct-0905
moonshotai/kimi-k2-instruct
llama-3.1-8b-instant
allam-2-7b

*groq의 api사용

​ ​


어떻게 사용하면 되나요?

글 작성 후 자동으로 추천 카테고리가 표시됩니다

"Powered by AI" 버튼을 클릭하면 상세한 기술 정보를 확인할 수 있습니다

"추천 근거 보기"를 통해 AI의 판단 과정을 확인할 수 있습니다



추천 결과 활용

추천 수락: AI가 제시한 카테고리를 그대로 사용

근거 확인: 왜 이 카테고리를 추천했는지 상세한 분석 과정을 확인



정확도는 어떤가요?


지속적 학습: 실제 DSc의 수천건 이상의 게시글과 수백만개의 단어 데이터로 학습된 모델을 사용

신뢰도 표시: 각 추천에 대한 AI의 확신도를 백분율로 표시

투명성: 판단 근거와 사용된 키워드, 점수 계산 과정을 공개



개인정보는 안전한가요?

글의 내용은 분류 목적으로만 분석됩니다

개인정보는 수집하거나 저장하지 않습니다

모든 처리는 익명화된 텍스트 데이터만을 사용합니다



이용 시 참고사항

- 더 정확한 분류를 위한 팁

명확한 제목: 내용을 잘 표현하는 구체적인 제목 작성

충분한 본문: 너무 짧은 글보다는 적절한 분량의 내용 작성

일관성: 하나의 주제에 집중된 글일수록 정확도가 높아집니다



한계


복합적인 주제의 글은 분류가 어려울 수 있습니다

새로운 트렌드나 전문 용어는 학습 데이터 부족으로 정확도가 낮을 수 있습니다

짧은 글이나 맥락이 부족한 경우 추천 정확도가 떨어질 수 있습니다



문의 및 피드백

AI 분류 결과가 부정확하다고 느끼시거나, 개선 제안이 있으시다면 언제든 관리자에게 알려주세요. 여러분의 피드백은 시스템 개선에 소중한 자료가 됩니다.


본 서비스는 사용자 편의성 향상을 위해 제공되며, 최종 카테고리 선택은 항상 사용자의 판단에 따릅니다.



* 2025.09.11 기존 모델에 학습 데이터 편향 보정 기능을 추가하여 정확도를 크게 향상시켰습니다.

2025.09.11까지 총 300만 개 이상의 데이터 학습됨

좋아요11 이 글을 좋아요하셨습니다
url 복사 카카오톡 공유 라인 공유 페이스북 공유 트위터 공유
생활-라이프
Powered by AI
정상
Powered by AI

등록된 댓글이 없습니다.

접속자집계

오늘
3,134
어제
2,501
최대
42,418
전체
1,046,933