AI 모델 평가: Endor Labs가 평가 도구 공개

avatar
AI News
10-16
이 기사는 기계로 번역되었습니다
원문 표시

Endor Labs가 AI 모델의 보안, 인기도, 품질, 활동성을 기준으로 점수를 매기기 시작했습니다.

'Endor Scores for AI Models'로 알려진 이 독특한 기능은 Hugging Face에서 현재 사용 가능한 가장 안전한 오픈소스 AI 모델을 식별하는 과정을 간소화하는 것을 목표로 합니다. Hugging Face는 대규모 언어 모델(LLM), 기계 학습 모델, 기타 오픈소스 AI 모델 및 데이터 세트를 공유하는 플랫폼입니다.

이번 발표는 개발자들이 오픈소스 소프트웨어(OSS)의 초기 단계와 유사하게 Hugging Face와 같은 플랫폼에서 준비된 AI 모델을 점점 더 많이 활용하고 있다는 것을 반영합니다. 이 새로운 릴리스는 개발자들이 AI 모델로 "깨끗하게 시작"할 수 있게 함으로써 AI 거버넌스를 개선합니다.

Endor Labs의 공동 설립자이자 CEO인 Varun Badhwar는 "코드가 의존하는 모든 것을 보안하는 것이 항상 우리의 사명이었으며, AI 모델은 이 중요한 과제에서 다음 큰 영역"이라고 말했습니다.

Endor Labs의 설립 엔지니어인 George Apostolopoulos는 "모든 사람들이 현재 AI 모델을 실험하고 있습니다. 일부 팀은 완전히 새로운 AI 기반 비즈니스를 구축하고 있고, 다른 팀은 제품에 '인공 지능 기반'이라는 스티커를 붙이는 방법을 찾고 있습니다. 한 가지 확실한 것은 개발자들이 AI 모델을 가지고 놀고 있다는 것입니다."

그러나 이러한 편의성에는 위험이 따릅니다. Apostolopoulos는 현재 상황이 "황야와 같다"며, 사람들이 잠재적인 취약점을 고려하지 않고 자신의 요구에 맞는 모델을 가져가고 있다고 경고했습니다.

Endor Labs의 접근 방식은 AI 모델을 소프트웨어 공급망 내의 종속성으로 취급합니다.

"Endor Labs의 사명은 '코드가 의존하는 모든 것을 보안하는 것'입니다." Apostolopoulos는 이 관점을 통해 조직이 다른 오픈소스 구성 요소에 적용하는 것과 유사한 위험 평가 방법론을 AI 모델에 적용할 수 있다고 설명했습니다.

Endor의 AI 모델 점수 매기기 도구는 다음과 같은 주요 위험 영역에 초점을 맞추고 있습니다:

  • 보안 취약점: 사전 학습된 모델에는 악성 코드 또는 모델 가중치 내의 취약점이 포함될 수 있으며, 이는 조직의 환경에 통합될 때 보안 침해로 이어질 수 있습니다.
  • 법적 및 라이선스 문제: AI 모델과 학습 데이터 세트의 복잡한 계보를 고려할 때 라이선스 조건 준수가 중요합니다.
  • 운영 위험: 사전 학습된 모델에 대한 의존성은 관리하고 보안을 유지하기 어려운 복잡한 그래프를 만듭니다.

이러한 문제를 해결하기 위해 Endor Labs의 평가 도구는 Hugging Face의 AI 모델에 50개의 기본 점검을 적용합니다. 이 시스템은 유지 관리자 수, 기업 후원, 릴리스 빈도, 알려진 취약점 등의 요인을 기반으로 "Endor 점수"를 생성합니다.

Endor Labs의 AI 모델 점수 매기기 도구 스크린샷.

AI 모델 점수 매기기 시스템의 긍정적인 요인에는 안전한 가중치 형식 사용, 라이선스 정보 제공, 높은 다운로드 및 참여 지표가 포함됩니다. 부정적인 요인에는 불완전한 문서화, 성능 데이터 부족, 안전하지 않은 가중치 형식 사용이 포함됩니다.

Endor 점수의 핵심 기능은 사용자 친화적인 접근 방식입니다. 개발자는 특정 모델 이름을 알 필요가 없으며, "감정 분류에 사용할 수 있는 모델은 무엇인가?" 또는 "Meta의 가장 인기 있는 모델은 무엇인가?"와 같은 일반적인 질문으로 검색을 시작할 수 있습니다. 그러면 도구가 각 모델의 긍정적 및 부정적 측면에 대한 명확한 점수를 제공하여 개발자가 자신의 요구에 가장 적합한 옵션을 선택할 수 있습니다.

"팀들은 매일 AI에 대해 질문을 받고 있으며, 혁신을 가속화할 수 있는 모델을 찾을 것입니다." Apostolopoulos는 "Endor Labs를 통한 오픈소스 AI 모델 평가를 통해 사용 중인 모델이 예상대로 작동하고 안전하게 사용할 수 있는지 확인할 수 있습니다."라고 말했습니다.

(사진 제공: Element5 Digital)

관련 기사: 중국 텔레콤, 국내 칩에서 1조 개 매개변수의 AI 모델 학습

업계 리더들로부터 AI와 빅데이터에 대해 더 자세히 알아보고 싶으신가요? AI & Big Data Expo에 참석해 보세요. 암스테르담, 캘리포니아, 런던에서 개최되는 이 종합 행사는 Intelligent Automation Conference, BlockX, Digital Transformation Week, Cyber Security & Cloud Expo와 함께 개최됩니다.

TechForge에서 제공하는 다른 upcoming 엔터프라이즈 기술 행사 및 웨비나를 여기에서 확인하세요.

이 기사는 AI News에 처음 게재되었습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트