log
cline을 써보면서 느낀 점 + minimax m2.7의 스펙 작성 능력?
오늘 나만의 코딩 에이전트를 만들면서 로컬에서 돌릴만한 SOTA급의 모델인 minimax m2.7의 스펙 작성 능력을 테스트해보기 위해서 하네스로 cline을 vscode extension 형태로 써보았습니다.
대략적인 플로우입니다.
- opus4.7이 비전 문서를 작성 + gpt5.5가 리뷰
- 작성된 비전 문서의 첫번째 마일스톤을 기준으로 스펙 문서 작성을 minimax에게 시킴 (프롬프트는 gpt5.5로 작성)
- 작성한 스펙을 opus와 gpt가 각각 리뷰
먼저 cline의 경험 부터 이야기 해보자면 불편한 점들이 좀 있습니다.
- plan mode로 스펙작성을 시키면 정보를 모으고 스펙 작성 준비를 완료합니다.
- 그러면 그냥 바로 act모드로 스스로 전환해서 작성하면 좋은데 작성해라고 프롬프틀 입력해도 작성을 하지 않고 act모드로 전환해서 시켜도 thinking을 자꾸 합니다.
- 결국 계속 cancle하고 다시 작성시키기를 반복하면 그제서야 작성을 합니다. 클로드 코드의 plan mode와 비교하면 굉장히 불편함 경험입니다.
- 스펙 작성과 같이 시간이 몇분씩 걸리는 작업에서는 Thinking이라고만 뜨니 이게 실제로 되는건지 불안감이 몰려옵니다. 클로드 코드처럼 진행되는 시간을 보여준다면 더 좋을 것 같습니다.
- 진짜 cancel한후에 잘하고 있어라고 몇번을 물어봤는지 모릅니다.
- 또한 broswer use는 사이트에 접속까지만 되고 그 후부터는 에러가 발생합니다.
Minimax m2.7의 경우에는
- 중국어가 아주 가끔씩 섞여서 나옵니다. 거의 없는 수준입니다.
Claude Code의 평가

GPT의 평가

Nvidia nim api의 경우에는 느린편이긴 합니다.

추가 - 2026.5.2 thinking을 너무 오래하거나 무한 루프를 도는 등의 버그가 좀 있습니다. 물론 cancel하고 다시 하면 잘 재개하는 편입니다. 더 찾아보니 애초에 스펙 문서 같은 작업에 최적화된 모델이 아니여서 worker로 쓰는 걸로 우회했습니다.
모델이 어떤 작업에 최적화되어있고 어떤 작업에 약한지 알아보기!