Skip to content
View softkleenex's full-sized avatar

Highlights

  • Pro

Block or report softkleenex

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
softkleenex/README.md

🚀 Hello, World! I'm Sangjae Lee (이상재)

🧠 AI/ML Engineer · Vision & Multimodal AI · Agentic AI System Builder


🙋‍♂️ About Me

"데이터의 신뢰성과 체계적인 엔지니어링을 바탕으로, 사용자에게 실질적인 가치를 전달하는 AI/ML 엔지니어 이상재입니다."

저는 경북대학교 컴퓨터학부에서 글로벌소프트웨어를 전공하고 인공지능공학부를 부전공하며 이론적 기반을 견고히 다졌습니다. 단순히 모델을 학습시키는 것에 그치지 않고, 고성능 AI 모델과 실서비스 백엔드 파이프라인의 유기적인 연결에 깊은 관심을 가지고 있습니다.

  • 실전 문제 해결 능력: DACON K리그 패스 좌표 예측 상위 7%, 2026 PIIX Contest 대상(1등), Kaggle Stanford RNA 3D 구조 예측 상위 48.2% 등 다양한 고난도 챌린지에서 실력을 완벽히 검증했습니다.
  • 최신 AI 에이전트 설계: MedGemma 의료 AI, AIMO 자율 수학 솔버, FastMCP 기반 날씨 비서, LLM-Driven Autonomous MLOps 파이프라인 등 최신 LLM 및 에이전트 시스템 아키텍처를 선제적으로 설계하고 구현합니다.
  • 기획 및 팀 협업 역량: 해커톤 최우수상 등을 거치며 서비스 기획 단계부터 클라우드 배포 및 모니터링까지 전 과정을 주도적으로 이끌어내는 협업 중심의 인재입니다.

📅 Chronological Project Timeline (연도별 프로젝트 타임라인)

전부 GitHub에 실제 오픈소스로 등재된 사실 관계가 완전히 검증된 14개의 인공지능 모델링 및 에이전트 시스템 구축 성과입니다.

🚀 2026


🌟 2025

💎 Projects & Competitions Detailed (프로젝트 및 경진대회 상세 설명)

🚀 2026

LLM-Driven Autonomous MLOps: Stanford RNA (Kaggle Competition)

Kaggle RNA 3D 구조 예측 대회를 해결하는 완전 자율 AI 에이전트 MLOps 파이프라인 (2026.05)

  • 주요 성과:
    • DACON/Kaggle 참가팀 중 최종 상위 48.2% (905위 / 1,877팀) 달성.
    • LLM 에이전트 ensembler 기반의 Autonomous MLOps Loop 기획 및 구축.
    • 연구원(Scout), 코드 주입(Coder), 검증(Tester), 배포(Orchestrator), 성찰(Reflector)의 5개 AI 페르소나 자율 작동 시스템 설계.
    • Biophysics 도메인 지식(A-form 헬릭스 대칭, 마이너 그루브 폭 규칙 등)을 자율적으로 추출하여 PyTorch 기반 물리 제약 손실 함수에 동적 주입.
    • Kaggle API 연계 자동 커널 패칭, 로컬 더미 데이터셋 QA self-correction 탑재로 에러 원천 차단.
  • 🛠️ Tech Stack: Python PyTorch Autonomous MLOps Kaggle API LLM Agents Constraint Injection
  • 🔗 Link: GitHub Repository

2026 PIIX Contest - 대상 수상작 Cloud-I (공모전)

사용자의 감정을 분석하여 날씨로 나타내 주는 감정 회고 무드등 Cloud-I 제품 디자인 (2026.03 - 2026.04)

  • 주요 성과:
    • 2026 PIIX Contest 대상(Grand Prize, 1등) 수상.
    • 사용자의 일일 감정을 입력받아 감정 회고에 기반해 유리 돔 속 구름의 색감과 오로라 조명을 변경하는 AI 가전 디자인 기획.
    • 생성 AI 이미지 도출 과정에서 프롬프트 최적화 기법을 정형화하여 일관된 컨셉 디자인 10장 확보 및 이미지 반영률 80% 이상 고정.
  • 🛠️ Tech Stack: Generative AI Prompt Engineering Product Design Concept Art
  • 🔗 Link: GitHub Repository

MedGemma Sentinel (Kaggle Impact Challenge)

의료진용 실시간 중증도 트리아지 및 환자용 진료소견서 번역 듀얼 에이전트 RAG 시스템 (2026.01 - 2026.02)

  • 주요 성과:
    • MedGemma 1.5-4B 경량 LLM 기반의 Dual-Agent Architecture 설계. 의사용 트리아지 분석 에이전트(Agent A)와 환자용 구어체 번역 에이전트(Agent B) 역할 분담.
    • MedQuAD 의학 질의응답 데이터셋과 FAISS 벡터 DB를 연계한 RAG 파이프라인으로 환각 현상(Hallucination) 원천 제어.
    • 대학원 수준(Grade 15.3)의 복잡한 전문 임상 용어를 대중적(Grade 7.2) 수준의 쉬운 건강 안내 문서로 고밀도 실시간 변환.
  • 🛠️ Tech Stack: Python MedGemma 1.5-4B FAISS SentenceTransformers RAG
  • 🔗 Link: GitHub Repository

AIMO Prize 3 Solver (Kaggle Competition)

국제 수학 올림피아드(IMO) 주관식 수학 문항을 자율 디버깅으로 해결하는 AI Solver (2025.11 - 2026.02)

  • 주요 성과:
    • Qwen2.5-Math-7B 모델 기반의 TIR (Tool-Integrated Reasoning) 추론 파이프라인 독자 설계.
    • 실행 과정의 구문 에러를 캡처하여 스스로 추론 경로와 프롬프트를 재구성하는 자가 수정(Self-Correction) 피드백 루프 구현.
    • Kaggle Inference Server 환경에 맞춘 예외 처리 및 시간 제한 샌드박스를 도입하여 메모리 오버플로우와 락 현상 100% 방지.
  • 🛠️ Tech Stack: Python Qwen2.5-Math-7B TIR Sandbox Self-Correction
  • 🔗 Link: GitHub Repository

심장 질환 예측 (Kaggle Playground S6E2)

정형 데이터 기반의 심장 질환 발생률 예측 이진 분류 앙상블 모델 (2026.01 - 2026.02)

  • 주요 성과:
    • CatBoost, LightGBM, XGBoost 모델 학습 및 하이퍼파라미터 튜닝 최적화.
    • 개별 모델들의 오버피팅을 방지하고 일반화 성능 극대화를 위한 Hill Climbing 기반 가중치 최적화 앙상블 기법 적용.
  • 🛠️ Tech Stack: Python CatBoost LightGBM XGBoost Hill Climbing Ensemble
  • 🔗 Link: GitHub Repository

Weather Life MCP v3.7 (PlayMCP 공모전 출품작)

기상 API 및 라이프스타일 지수를 연동 제공하는 FastMCP 표준 건강 날씨 에이전 (2025.12 - 2026.01)

  • 주요 성과:
    • FastMCP 프레임워크 기반 30개 커스텀 툴(Tool) 개발 및 기상청/에어코리아/카카오맵 API 연동.
    • FastMCP 표준 프로토콜 표준 규격 및 30개 커스텀 도구 구현 기준 자체 테스트 100% 만족 통과.
    • MIT/Yale 등 과학 논문 데이터에 기반하여 체감 온도, 열사병 지수 등 신뢰성 있는 건강 지수 산출 공식 구현.
    • 사용자 위치 기반 맛집, 추천 장소, 코스 링크의 완전 자동화 맵핑 기능 탑재.
  • 🛠️ Tech Stack: Python FastMCP REST API Kakao Maps API Railway
  • 🔗 Link: GitHub Repository

K리그 패스 좌표 예측 AI 경진대회 (DACON)

K리그 경기 데이터를 기반으로 마지막 패스의 x, y 도착 좌표를 정확히 복원하는 ML 모델 (2025.12 - 2026.01)

  • 주요 성과:
    • DACON 최종 상위 7% (121위 / 1,740팀) 달성.
    • 절대 좌표 대신 이전 위치 대비 변화량(dx, dy)을 타겟으로 설정하여 모델 일반화 성능 극대화.
    • 준지도 학습 기법인 Iterative Pseudo-Labeling을 도입하여 테스트 데이터 예측의 정확도 고도화.
  • 🛠️ Tech Stack: Python CatBoost LightGBM XGBoost Pseudo-Labeling
  • 🔗 Link: GitHub Repository

🌟 2025

유전체 변이 감지 AI 경진대회 (DACON)

유전체 서열 데이터 분석을 통한 변이 민감도 평가 딥러닝 모델 (2025.11 - 2025.12)

  • 주요 성과:
    • 단독 참여로 최종 101위 기록.
    • 유전체 DNA 서열 데이터의 극심한 클래스 불균형 제어를 위해 대조 학습(Contrastive Learning) 도입 및 PyTorch 기반 커스텀 손실 함수 실험.
  • 🛠️ Tech Stack: Python PyTorch Contrastive Learning Custom Loss Function
  • 🔗 Link: GitHub Repository

SilverLink - AI 복지 도우미 (KNU 해커톤 최우수상)

디지털 소외 어르신을 위한 구어체 음성 대화형 복지 혜택 RAG 매칭 플랫폼 (2025.10 - 2025.11)

  • 주요 성과:
    • 경북대학교 AI-conic 해커톤 최우수상 (2등, 상금 60만원) 수상.
    • Google Gemini 2.5 Pro를 활용하여 음성과 텍스트가 양방향으로 연동되는 멀티모달 대화 시스템 기획 및 구축.
    • 정부 복지 가이드라인 데이터를 RAG로 연계하여 오정보(할루시네이션)를 방지하고 추천 적합도 산정 로직 구현.
  • 🛠️ Tech Stack: Python Streamlit Google Gemini API FAISS RAG STT/TTS
  • 🔗 Link: GitHub Repository

Kaggle ARC Prize 2025 (Kaggle)

AGI 추론 벤치마크 달성을 위한 시각 격자 패턴 인식 및 논리 규칙 추론 파이프라인 (2025.09 - 2025.11)

  • 주요 성과:
    • 추상적 격자 데이터의 색상/위치 형태 변화를 규칙화하는 시각 논리 추론 파이프라인 개발 및 최적화 진행.
  • 🛠️ Tech Stack: Python Grid Processing Visual Reasoning
  • 🔗 Link: GitHub Repository

토스 광고 CTR 예측 AI 경진대회 (DACON)

사용자 피처 및 광고 데이터를 활용한 고성능 클릭률(CTR) 예측 ML 모델 (2025.09 - 2025.10)

  • 주요 성과:
    • 유저-광고 간 상호작용 피처 등 42개의 고효율 파생변수 도출.
    • LightGBM, XGBoost 앙상블 기법 및 오버피팅을 제어하는 고정밀 하이퍼파라미터 튜닝 적용.
  • 🛠️ Tech Stack: Python LightGBM XGBoost Feature Engineering
  • 🔗 Link: GitHub Repository

Hull Tactical Market (금융 시계열 예측)

금융 시장 데이터 분석을 통한 시계열 수익률 예측 모델 (2025.09 - 2025.10)

  • 주요 성과:
    • 금융 시계열 데이터의 치명적인 데이터 누수(Data Leakage)를 원천 차단하는 Walk-Forward CV(교차 검증) 전략 채택 및 안정적 추론 확인.
  • 🛠️ Tech Stack: Python Scikit-Learn Walk-Forward CV Time-Series
  • 🔗 Link: GitHub Repository

해양수산부 이상감지 AI 경진대회 (DACON)

선박 엔진 및 해양 센서 데이터를 분석하여 물리 이상 상태를 실시간 감지하는 분류 모델 (2025.09 - 2025.10)

  • 주요 성과:
    • 센서 신호 데이터를 활용하여 최종 상위 236위 기록.
    • 149개의 물리 센서 통계적 피처 분석 및 이상 감지(Anomaly Detection)를 위한 파생 피처 설계.
  • 🛠️ Tech Stack: Python Scikit-Learn Feature Engineering Anomaly Detection
  • 🔗 Link: GitHub Repository

자동차 뉴스 분류 AI 경진대회 (DACON)

텍스트 데이터를 카테고리별로 고속 자동 분류하는 프롬프트 엔지니어링 (2025.08 - 2025.09)

  • 주요 성과:
    • 자체 검증 데이터셋 정확도 100% 달성.
    • GPT-4o-mini 모델 기반 고품질 Few-shot 프롬프트 엔지니어링 및 데이터 전처리 자동화 구축.
  • 🛠️ Tech Stack: Python GPT-4o-mini Few-shot Prompt Engineering
  • 🔗 Link: GitHub Repository

🛠️ Tech Stacks

AI/ML & Deep Learning

LLM & Agentic AI

Backend & Infrastructure


🏫 Education & Activity

  • 🎓 경북대학교 컴퓨터학부 (대구)
    • 글로벌소프트웨어학과 주전공 / 인공지능공학부 부전공
    • 2021.03 ~ 2027.03 (졸업 예정)
  • 💡 Solved.ac (백준 온라인 저지)
    • 지속적인 알고리즘 및 문제해결 트레이닝 (Gold 등급)
    • 그래프 이론, 동적 계획법(DP), 고급 자료구조 문제 해결 위주 학습

📬 Contact & Channels


방문해 주셔서 감사합니다! 함께 가치 있는 AI 시스템을 만들어가고 싶습니다. 🤝

Pinned Loading

  1. kaggle-jigsaw-acrc-portfolio kaggle-jigsaw-acrc-portfolio Public

    Systematic debugging of LLM adapter compatibility in Kaggle Jigsaw ACRC competition

    Jupyter Notebook