#AI

레거시 GPU에 날개 달기: 극한의 서빙 최적화 가이드

네이버 • 2025년 07월 17일

AI 요약

GPT로 자동 생성된 요약입니다

네이버 엔지니어링 데이 2025에서 발표된 세션으로, BERT 기반 SPLADE 모델의 실시간 서비스 최적화 방법과 빠른 텍토나이저인 FlashTokenizer 개발 배경과 성능을 소개합니다. 강의는 모델 간소화, 추론 최적화, 전처리 및 후처리 최적화 등 다양한 성능 향상 기법을 다룹니다. NAVER 엔지니어링 데이는 개발 경험과 기술 트렌드 공유를 위한 사내 행사입니다. 이번 세션은 실시간 서빙을 위한 인프라 최적화에 관심 있는 개발자를 대상으로 합니다.

원문 보기

관련 아티클

#AI

FE News 25년 8월

2025년 8월 소식에서는 JavaScript 컨퍼런스, AI와 디자인 결합, AI 시대의 코딩 방식, 웹 개발자가 AI로 대체 가능성 등 최신 개발 트렌드와 도구를 소개한다. React 및 SVG 활용법, 워크플로우 자동화 플랫폼, API 탐색 도구 등의 실용적인 기술도 포함된다. 국내외 개발자들을 위한 정보와 커뮤니티 소식을 동시에 전달한다. FE뉴스는 한국 개발자 대상의 기술 큐레이션을 지속적으로 제공한다.

네이버 • 2025-08-07

#AI

초개인화 Shopping Agent 만들기: Amazon Bedrock AgentCore Memory와 Custom Memory 활용법

생성형 AI 및 메모리 기술을 활용한 지능형 쇼핑 에이전트가 사용자 과거 경험과 선호도를 효과적으로 기억하고 맞춤 추천을 제공하는 방법을 소개합니다. AWS의 Bedrock AgentCore Memory와 Custom Memory 구조를 통해 대화 컨텍스트를 최적화하며, 불필요한 정보 과부하를 방지하여 개인화 수준을 높입니다. 실험 결과, Memory 기반 에이전트는 적은 토큰으로도 높은 사용자 이해와 정밀 추천이 가능하며, 전체 대화 기반 방법보다 우수한 성과를 보입니다. 이러한 시스템은 서버리스 자원 활용과 구조적 데이터 저장을 통해 개발 및 운영 부담을 줄이면서도 맞춤형 서비스 제공이 가능하게 합니다. 향후엔 노이즈 필터링, 행동별 가중치 조정 및 다양한 사용자 데이터 반영으로 더욱 정교화할 수 있습니다.

AWS코리아 • 2025-08-07

#AI

AWS R-Assistant: Amazon Bedrock 기반 자연어 인터페이스의 클라우드 리소스와 비용 관리를 위한 챗봇

이 블로그는 Amazon Bedrock 기반의 AWS R-Assistant 챗봇으로, 자연어 인터페이스와 대시보드로 클라우드 리소스 모니터링, 비용 분석, 최적화, 전문가 채팅 기능을 통합 제공하여 사용자 경험을 혁신하고 비용 절감과 운영 효율성을 높인다. 주요 기술로 Streamlit, Boto3, Pandas, Plotly, Bedrock Claude 3.5를 활용하며, 실시간 데이터 시각화와 AI 기반 인사이트가 강점이다. 코드 구조는 리소스 수집, 비용 분석, AI 모델 호출, 자연어 처리, 추천 기능 등으로 구성되며, 간단한 아키텍처로 확장성과 유지보수가 용이하다. 사용자 친화적 UI와 자연어 처리로 복잡한 클라우드 관리를 직관적이고 자동화하며, 향후 AI Agent 및 다양한 AWS 서비스 확장 가능성을 내포한다.

AWS코리아 • 2025-08-07

#AI

Amazon Bedrock을 활용한 (주)레듀텍의 독서 교육 콘텐츠 생성 자동화 시스템 구축

레듀텍은 Amazon Bedrock의 대규모 언어모델(LLM)을 활용하여 독서교육 콘텐츠의 문제 초안 자동생성 시스템을 구축했으며, 이를 통해 개발 비용과 시간을 크게 절감하고 콘텐츠 다양성을 확보했습니다. 시스템은 AWS Lambda와 다양한 AWS 서비스를 연동하여 PDF 텍스트 추출, 콘텐츠 생성, 검토 과정을 자동화하며, 프롬프트 관리와 캐싱으로 효율성을 높였습니다. 이를 바탕으로 교육 콘텐츠의 품질과 창의성을 강화하고 운영 효율성을 향상시켰으며, 비용도 크게 절감하였습니다. 클라우드 기반 아키텍처로 국내외 리전에서 고성능, 확장성을 실현하여 교육 분야 혁신을 선도하고 있습니다.

AWS코리아 • 2025-08-07

목록으로 돌아가기