AI 순위는 어떻게 매기는가
공개 벤치마크, 커뮤니티 리뷰, 가격, 최신성을 종합해 순위를 매깁니다. 모델과 도구는 성격이 다르므로 따로 평가합니다.
가중치
- 벤치마크 성능 40%
- LMSYS Arena Elo, MMLU, HumanEval, GPQA 등 공개 벤치마크.
- 실사용 평판 30%
- 커뮤니티 리뷰·전문가 분석·소셜 미디어 반응. AI 기반으로 수집·요약.
- 접근성과 가격 20%
- 무료 tier, 가격 정책, API 제공, 사용 편의성.
- 최신성 10%
- 최근 업데이트 빈도와 새 기능 출시 속도.
티어
- S — S 티어 — 90 이상
- A — A 티어 — 80 ~ 89
- B — B 티어 — 70 ~ 79
- C — C 티어 — 70 미만
주간 큐레이션 (백과사전이 아님)
- 리서치는 주간 리듬으로 갱신하고, 태스크별 목록은 의도적으로 짧게 유지합니다. 완전성보다 실사용·신선도를 우선합니다.
- 신규 후보는 최근 약 6개월 안에 출시·변경로그·가격 등 신뢰할 만한 활동이 있어야 합니다.
- 오래된 항목이라도 커뮤니티에서 여전히 강한 평판(지속적 채택)이 보이면 유지할 수 있습니다.
- 신선도와 평판 신호가 모두 약하면 검토 대상으로 표시할 수 있으며, 이는 편집 가이드일 뿐 자동 퇴장은 아닙니다.
인정하는 한계
- 완벽히 객관적인 순위는 없습니다 — 벤치마크가 실사용을 모두 담지 못합니다.
- AI 기반 여론 수집은 오류가 있을 수 있어 게시 전 확인합니다.
- 권위 있는 판정이 아닌, 공개 데이터를 근거로 한 의견 제시입니다.
출처가 확인되지 않은 평가는 게시하지 않습니다.
정정 정책
제품 제공사의 정정 요청에 24시간 내 응답합니다. 푸터 "잘못된 정보 제보" 를 이용해 주세요.
최근 가중치 조정: 2026-04-28