2026-04-30 log

cline을 써보면서 느낀 점 + minimax m2.7의 스펙 작성 능력?

오늘 나만의 코딩 에이전트를 만들면서 로컬에서 돌릴만한 SOTA급의 모델인 minimax m2.7의 스펙 작성 능력을 테스트해보기 위해서 하네스로 cline을 vscode extension 형태로 써보았습니다.

대략적인 플로우입니다.

먼저 cline의 경험 부터 이야기 해보자면 불편한 점들이 좀 있습니다.

plan mode로 스펙작성을 시키면 정보를 모으고 스펙 작성 준비를 완료합니다.
그러면 그냥 바로 act모드로 스스로 전환해서 작성하면 좋은데 작성해라고 프롬프틀 입력해도 작성을 하지 않고 act모드로 전환해서 시켜도 thinking을 자꾸 합니다.
결국 계속 cancle하고 다시 작성시키기를 반복하면 그제서야 작성을 합니다. 클로드 코드의 plan mode와 비교하면 굉장히 불편함 경험입니다.
스펙 작성과 같이 시간이 몇분씩 걸리는 작업에서는 Thinking이라고만 뜨니 이게 실제로 되는건지 불안감이 몰려옵니다. 클로드 코드처럼 진행되는 시간을 보여준다면 더 좋을 것 같습니다.
진짜 cancel한후에 잘하고 있어라고 몇번을 물어봤는지 모릅니다.
또한 broswer use는 사이트에 접속까지만 되고 그 후부터는 에러가 발생합니다.

Minimax m2.7의 경우에는

Claude Code의 평가

GPT의 평가

Nvidia nim api의 경우에는 느린편이긴 합니다.

추가 - 2026.5.2 thinking을 너무 오래하거나 무한 루프를 도는 등의 버그가 좀 있습니다. 물론 cancel하고 다시 하면 잘 재개하는 편입니다. 더 찾아보니 애초에 스펙 문서 같은 작업에 최적화된 모델이 아니여서 worker로 쓰는 걸로 우회했습니다.

모델이 어떤 작업에 최적화되어있고 어떤 작업에 약한지 알아보기!