VentureBeat에 따르면 기업들은 검색 증강 생성(RAG) 시스템에서 어려움을 겪고 있는데, 표준 전처리 방식으로는 복잡한 문서를 적절히 처리하지 못하는 경우가 많기 때문입니다. 검색 실패는 신뢰, 규정 준수 및 운영 안정성과 관련된 비즈니스 위험으로 이어질 수 있으며, 새로움, 거버넌스 및 평가를 우선시하는 검색 플랫폼 설계를 위한 시스템 수준의 접근 방식이 필요합니다.
VentureBeat에 따르면 많은 기업들이 PDF를 색인하고, 대규모 언어 모델(LLM)을 연결하고, 기업 지식을 즉시 민주화하기를 바라며 RAG의 일부 형태를 배포했습니다. 그러나 중공업에 의존하는 산업의 경우, 엔지니어들이 인프라에 대한 구체적인 질문을 하고 봇이 환각을 일으키는 등 현실은 기대에 미치지 못했습니다.
VentureBeat는 실패 원인이 LLM이 아니라 전처리에 있다고 보도했습니다. 표준 RAG 파이프라인은 문서를 평면적인 텍스트 문자열로 취급하여 "고정 크기 청킹"(문서를 500자마다 자르는 방식)을 사용합니다. 이는 산문에는 효과적이지만 기술 매뉴얼의 논리를 파괴하고, 표를 반으로 자르고, 이미지에서 캡션을 분리하고, 페이지의 시각적 계층 구조를 무시합니다.
다른 기술 뉴스에서는 Hacker News에 따르면 Xteink X4 전자책 리더기 및 AI 기반 필기 도구와 같은 기술 장치를 포함한 다양한 주제에 대해 여러 소스가 보도했습니다. 인도네시아는 동의 없는 이미지 생성에 대한 우려가 해결된 후 xAI의 Grok 챗봇에 대한 금지 조치를 조건부로 해제했습니다. 서비스 산업의 자동화도 증가하고 있으며, 시애틀의 로봇 바리스타 Jarvis가 그 예입니다.
한편, Nature News에 따르면 과학자들은 약탈적 학술지와 학회에 주의하라는 경고를 받고 있습니다. Aletheia-Probe라는 혁신적인 도구는 학술지와 학회의 평점을 간단하게 확인할 수 있는 방법을 제공하므로 사용자는 어떤 것을 신뢰할 수 있는지 더 잘 평가할 수 있습니다. 과학자들은 종종 자신의 논문을 형편없는 서비스에 대한 대가로 돈을 기꺼이 받는 학술지와 학회에 제출하도록 초대하는 아첨하는 이메일을 받습니다. 해당 출판물은 동료 검토 과정을 소홀히 하거나 몇 달 후에 사라질 수 있으며, 학회는 텅 빈 회의실로 구성될 수 있습니다.
엔터테인먼트 뉴스에서는 HBO 금융 드라마 "Industry"가 경계를 허무는 스토리텔링으로 주목을 받고 있다고 Time이 보도했습니다. 현재 시즌 4를 맞이한 이 시리즈는 런던의 트레이딩 플로어에서 시작하여 권력, 계급, 성별, 인종 및 개인의 도덕성에 대한 보다 광범위한 탐구로 나아갔습니다.
Discussion
AI 전문가 & 커뮤니티
첫 댓글을 남겨보세요