AI 순위는 어떻게 매기는가

공개 벤치마크, 커뮤니티 리뷰, 가격, 최신성을 종합해 순위를 매깁니다. 모델과 도구는 성격이 다르므로 따로 평가합니다.

가중치

벤치마크 성능: LMSYS Arena Elo, MMLU, HumanEval, GPQA 등 공개 벤치마크.
실사용 평판: 커뮤니티 리뷰·전문가 분석·소셜 미디어 반응. AI 기반으로 수집·요약.
접근성과 가격: 무료 tier, 가격 정책, API 제공, 사용 편의성.
최신성: 최근 업데이트 빈도와 새 기능 출시 속도.

티어

S — S 티어 — 90 이상
A — A 티어 — 80 ~ 89
B — B 티어 — 70 ~ 79
C — C 티어 — 70 미만

주간 큐레이션 (백과사전이 아님)

리서치는 주간 리듬으로 갱신하고, 태스크별 목록은 의도적으로 짧게 유지합니다. 완전성보다 실사용·신선도를 우선합니다.
신규 후보는 최근 약 6개월 안에 출시·변경로그·가격 등 신뢰할 만한 활동이 있어야 합니다.
오래된 항목이라도 커뮤니티에서 여전히 강한 평판(지속적 채택)이 보이면 유지할 수 있습니다.
신선도와 평판 신호가 모두 약하면 검토 대상으로 표시할 수 있으며, 이는 편집 가이드일 뿐 자동 퇴장은 아닙니다.

인정하는 한계

완벽히 객관적인 순위는 없습니다 — 벤치마크가 실사용을 모두 담지 못합니다.
AI 기반 여론 수집은 오류가 있을 수 있어 게시 전 확인합니다.
권위 있는 판정이 아닌, 공개 데이터를 근거로 한 의견 제시입니다.

출처가 확인되지 않은 평가는 게시하지 않습니다.

정정 정책

제품 제공사의 정정 요청에 24시간 내 응답합니다. 푸터 "잘못된 정보 제보" 를 이용해 주세요.

최근 가중치 조정: 2026-06-04