log

cline을 써보면서 느낀 점 + minimax m2.7의 스펙 작성 능력?

오늘 나만의 코딩 에이전트를 만들면서 로컬에서 돌릴만한 SOTA급의 모델인 minimax m2.7의 스펙 작성 능력을 테스트해보기 위해서 하네스로 cline을 vscode extension 형태로 써보았습니다.

대략적인 플로우입니다.

  1. opus4.7이 비전 문서를 작성 + gpt5.5가 리뷰
  2. 작성된 비전 문서의 첫번째 마일스톤을 기준으로 스펙 문서 작성을 minimax에게 시킴 (프롬프트는 gpt5.5로 작성)
  3. 작성한 스펙을 opus와 gpt가 각각 리뷰

먼저 cline의 경험 부터 이야기 해보자면 불편한 점들이 좀 있습니다.

Minimax m2.7의 경우에는

Claude Code의 평가

GPT의 평가

Nvidia nim api의 경우에는 느린편이긴 합니다.

추가 - 2026.5.2 thinking을 너무 오래하거나 무한 루프를 도는 등의 버그가 좀 있습니다. 물론 cancel하고 다시 하면 잘 재개하는 편입니다. 더 찾아보니 애초에 스펙 문서 같은 작업에 최적화된 모델이 아니여서 worker로 쓰는 걸로 우회했습니다.

모델이 어떤 작업에 최적화되어있고 어떤 작업에 약한지 알아보기!