<출처 : 한국건설신문> http://www.conslove.co.kr/news/articleView.html?idxno=87928
건설과 AI를 모두 설계해본 특화 도메인 AI의 조건

<두아즈 김영태 대표>
■ ChatGPT에게 말뚝 기초를 맡길 수 있나
2024년 초, 한 대형 건설사의 팀장이 필자에게 물었다. "요즘 ChatGPT가 다 해준다던데, 지반조사 보고서도 AI로 자동으로 만들 수 있나요?" 필자는 그 자리에서 직접 시연했다. GPT-4에게 실제 시추 데이터를 넣고 N값 기반 지지력 산정을 요청했다.
결과는 참담했다. Meyerhof 공식의 계수를 잘못 적용했고, 단위 변환에서 오류가 발생했으며, 존재하지 않는 시방서와 법률 조항을 인용했다. 그럴듯한 문장으로 포장된, 그러나 현장에서 쓰면 사고로 이어질 수 있는 답변이었다.
이것이 범용 AI의 본질적 한계다. 언어를 '잘' 다루는 것과 엔지니어링을 '정확히' 수행하는 것은 전혀 다른 문제다.
필자는 대우건설에서 16년간 19개국의 해양·플랜트 프로젝트를 수행하며 수천 장의 계산서를 작성하고 검토했다. 또한 산업 특화 AI 스타트업을 3년 동안 창업해서 운영했다.
그 경험으로 단언한다. 건설 엔지니어링에서 95%의 정확도는 0%와 같다. 구조 계산서의 숫자 하나, 설계기준 조항 하나가 틀리면 인명과 직결된다.
범용 AI가 가진 '환각(Hallucination)'은 일상 대화에서는 사소한 실수지만, 건설 현장에서는 치명적 리스크로 다가올 수밖에 없다.
■ 건설현장의 진짜 문제는 어디 있는가
건설 산업의 디지털 전환이 더딘 이유를 묻는 사람들이 많다. 답은 단순하다. 건설 현장의 문제는 범용 기술로는 풀 수 없을 만큼 깊고 복잡하기 때문이다.
첫째, 비정형 데이터의 벽이다. 건설 프로젝트 하나에 생산되는 문서는 수만 장이다. 지반조사보고서, 구조계산서, 시방서, 도면, 이 문서들은 PDF, CAD, 스캔 이미지가 뒤섞여 있고, 같은 형식이 두 번 반복되는 법이 없다.
범용 OCR로는 도면 위의 시추공 좌표 하나 제대로 읽지 못한다. 우리가 소방도면 10,000장을 학습시켜 99% 이상의 기호 인식률을 달성하기까지, 범용 모델의 인식률은 40%에도 미치지 못했다.
둘째, 공학 계산의 정밀성이다. 건설 AI는 '대략 이 정도'라는 답을 낼 수 없다. 말뚝의 지지력, 흙막이 벽체의 변위, 철근 배근량, 모두 물리 법칙과 설계기준에 따른 정확한 수치가 필요하다.
범용 LLM은 확률 기반으로 다음 단어를 예측하는 모델이다. 공학 수식을 '계산'하는 것이 아니라 '추측'한다. 이 근본적 구조가 바뀌지 않는 한, 범용 AI에게 엔지니어링 계산을 맡기는 것은 위험하다.
셋째, 규정과 기준의 복잡성이다. 한국의 건설 설계기준(KDS/KCS)만 해도 수천 페이지에 달한다. 여기에 발주처별 특별시방서, 국제 규정(IMO, IACS, ACI)이 겹친다.
숙련된 엔지니어도 하나의 설계를 검토하는 데 며칠이 걸리는데, 범용 AI는 이 규정들의 존재조차 정확히 파악하지 못하고 있는 조항을 빠뜨리거나, 없는 조항을 만들어낸다.
■ 도메인 AI는 어떻게 문제를 해결하는가
그렇다면 건설에 특화된 AI는 무엇이 다른가. 핵심은 크게 세 가지로 나뉜다.
수식은 수식 엔진이 풀어야 한다. 우리는 LLM에게 계산을 맡기지 않는다. 별도의 Math Engine — Symbolic AI와 수치해석 솔버를 결합한 전용 연산 엔진 — 이 모든 공학 계산을 수행한다.
LLM은 맥락을 이해하고 판단하는 역할을 하고, 숫자는 수학이 처리한다. 이 분리 구조가 '환각 없는 엔지니어링 AI'의 출발점이다.
규정은 코드가 돼야 한다. 수천 페이지의 설계기준을 AI가 '읽고 이해하게' 하는 것은 한계가 있으며, 대신 규정 자체를 실행 가능한 코드(Rule-as-Code)로 변환한다.
"KDS 11 50 40에 따라 극한지지력은 다음 조건을 만족해야 한다"라는 텍스트가, 입력값을 넣으면 적합/부적합을 즉시 판정하는 로직이 된다. 이렇게 하면 AI가 규정을 '환각'할 여지 자체가 사라진다.
데이터는 현장에서 와야 한다. 인터넷에 공개된 건설 데이터로는 실무 수준의 AI를 만들 수 없다. 실제 시추 데이터, 실제 계산서, 실제 도면 — 현장 실무자들이 수십 년간 축적한 노하우가 데이터로 전환돼야 한다.
필자가 포스코이앤씨와 1년간 협업하며 학습에 활용한 수백 건 이상의 지반조사 데이터는, 이 과정 없이는 어떤 기술 기업도 5년 안에 복제할 수 없는 자산이다.
이 세 가지가 결합될 때 비로소 "엔지니어가 신뢰할 수 있는 AI"가 된다. 우리의 GeoAI Suite가 지반조사 자동화에서 96% 이상의 정확도를 달성한 것은 LLM이 뛰어나서가 아니라, LLM이 하지 못하는 영역을 별도의 엔진이 보완하는 하이브리드 구조 덕분이다.
■ AI가 바꾸는 건설의 경제학
도메인 AI의 가치는 단순히 기술적 정확성에 그치지 않고, 산업의 경제 구조 자체를 바꿀 수 있다.
과거에는 깊은 도메인 문제를 소프트웨어로 해결하려면 수백억원의 개발비가 필요했다. 그래서 건설 IT 시장은 대형 SI 프로젝트 아니면 피상적 SaaS — 양 극단만 존재했다.
그러나 AI, 특히 LLM의 등장으로 개발비가 1/10로 떨어졌으며, 이제 비로소 깊은 도메인 문제를 경제적으로 풀 수 있는 시대가 열렸다.
300억원이 들던 문제를 30억원에 해결할 수 있다면, 그동안 "비용 대비 효과가 없다"며 방치되던 수많은 현장의 비효율이 해결 대상이 된다.
이것이 건설 AI의 진정한 기회다 — 새로운 기술을 도입하는 것이 아니라, 풀 수 없었던 문제를 풀 수 있게 되는 것이다.
■ 범용 AI 시대, 도메인 전문가의 역할
마지막으로 한 가지 질문을 던지고 싶다. GPT-5, Claude 4.6 등 범용 AI가 더욱 강력해지면 도메인 AI는 불필요해지는가? 필자는 이 질문에 '아니다'라고 답하고 싶다.
범용 AI가 올라올수록, 그 위에 얹힐 도메인 지식·데이터·규정의 가치는 더 커진다. 엔진이 아무리 강력해도 연료가 없으면 달릴 수 없다. 15,000건의 현장 데이터, 수천 페이지의 Rule-as-Code, 대기업 현장에서 검증된 워크플로우 — 이것들은 범용 AI가 스스로 만들어낼 수 없는 자산이다.
건설 산업에 AI를 도입하겠다는 것은, ChatGPT를 현장에 가져다 놓겠다는 뜻이 아니다. 현장의 문제를 정의하고, 그 문제에 맞는 AI 구조를 설계하고, 현장의 데이터로 검증하는 — 이 지난한 과정을 거쳐야 한다는 뜻이다.
기술이 아닌 문제에서 출발하는 것. 그것이 건설 AI의 첫번째 조건이다.
<출처 : 한국건설신문> http://www.conslove.co.kr/news/articleView.html?idxno=87928
건설과 AI를 모두 설계해본 특화 도메인 AI의 조건
<두아즈 김영태 대표>
■ ChatGPT에게 말뚝 기초를 맡길 수 있나
2024년 초, 한 대형 건설사의 팀장이 필자에게 물었다. "요즘 ChatGPT가 다 해준다던데, 지반조사 보고서도 AI로 자동으로 만들 수 있나요?" 필자는 그 자리에서 직접 시연했다. GPT-4에게 실제 시추 데이터를 넣고 N값 기반 지지력 산정을 요청했다.
결과는 참담했다. Meyerhof 공식의 계수를 잘못 적용했고, 단위 변환에서 오류가 발생했으며, 존재하지 않는 시방서와 법률 조항을 인용했다. 그럴듯한 문장으로 포장된, 그러나 현장에서 쓰면 사고로 이어질 수 있는 답변이었다.
이것이 범용 AI의 본질적 한계다. 언어를 '잘' 다루는 것과 엔지니어링을 '정확히' 수행하는 것은 전혀 다른 문제다.
필자는 대우건설에서 16년간 19개국의 해양·플랜트 프로젝트를 수행하며 수천 장의 계산서를 작성하고 검토했다. 또한 산업 특화 AI 스타트업을 3년 동안 창업해서 운영했다.
그 경험으로 단언한다. 건설 엔지니어링에서 95%의 정확도는 0%와 같다. 구조 계산서의 숫자 하나, 설계기준 조항 하나가 틀리면 인명과 직결된다.
범용 AI가 가진 '환각(Hallucination)'은 일상 대화에서는 사소한 실수지만, 건설 현장에서는 치명적 리스크로 다가올 수밖에 없다.
■ 건설현장의 진짜 문제는 어디 있는가
건설 산업의 디지털 전환이 더딘 이유를 묻는 사람들이 많다. 답은 단순하다. 건설 현장의 문제는 범용 기술로는 풀 수 없을 만큼 깊고 복잡하기 때문이다.
첫째, 비정형 데이터의 벽이다. 건설 프로젝트 하나에 생산되는 문서는 수만 장이다. 지반조사보고서, 구조계산서, 시방서, 도면, 이 문서들은 PDF, CAD, 스캔 이미지가 뒤섞여 있고, 같은 형식이 두 번 반복되는 법이 없다.
범용 OCR로는 도면 위의 시추공 좌표 하나 제대로 읽지 못한다. 우리가 소방도면 10,000장을 학습시켜 99% 이상의 기호 인식률을 달성하기까지, 범용 모델의 인식률은 40%에도 미치지 못했다.
둘째, 공학 계산의 정밀성이다. 건설 AI는 '대략 이 정도'라는 답을 낼 수 없다. 말뚝의 지지력, 흙막이 벽체의 변위, 철근 배근량, 모두 물리 법칙과 설계기준에 따른 정확한 수치가 필요하다.
범용 LLM은 확률 기반으로 다음 단어를 예측하는 모델이다. 공학 수식을 '계산'하는 것이 아니라 '추측'한다. 이 근본적 구조가 바뀌지 않는 한, 범용 AI에게 엔지니어링 계산을 맡기는 것은 위험하다.
셋째, 규정과 기준의 복잡성이다. 한국의 건설 설계기준(KDS/KCS)만 해도 수천 페이지에 달한다. 여기에 발주처별 특별시방서, 국제 규정(IMO, IACS, ACI)이 겹친다.
숙련된 엔지니어도 하나의 설계를 검토하는 데 며칠이 걸리는데, 범용 AI는 이 규정들의 존재조차 정확히 파악하지 못하고 있는 조항을 빠뜨리거나, 없는 조항을 만들어낸다.
■ 도메인 AI는 어떻게 문제를 해결하는가
그렇다면 건설에 특화된 AI는 무엇이 다른가. 핵심은 크게 세 가지로 나뉜다.
수식은 수식 엔진이 풀어야 한다. 우리는 LLM에게 계산을 맡기지 않는다. 별도의 Math Engine — Symbolic AI와 수치해석 솔버를 결합한 전용 연산 엔진 — 이 모든 공학 계산을 수행한다.
LLM은 맥락을 이해하고 판단하는 역할을 하고, 숫자는 수학이 처리한다. 이 분리 구조가 '환각 없는 엔지니어링 AI'의 출발점이다.
규정은 코드가 돼야 한다. 수천 페이지의 설계기준을 AI가 '읽고 이해하게' 하는 것은 한계가 있으며, 대신 규정 자체를 실행 가능한 코드(Rule-as-Code)로 변환한다.
"KDS 11 50 40에 따라 극한지지력은 다음 조건을 만족해야 한다"라는 텍스트가, 입력값을 넣으면 적합/부적합을 즉시 판정하는 로직이 된다. 이렇게 하면 AI가 규정을 '환각'할 여지 자체가 사라진다.
데이터는 현장에서 와야 한다. 인터넷에 공개된 건설 데이터로는 실무 수준의 AI를 만들 수 없다. 실제 시추 데이터, 실제 계산서, 실제 도면 — 현장 실무자들이 수십 년간 축적한 노하우가 데이터로 전환돼야 한다.
필자가 포스코이앤씨와 1년간 협업하며 학습에 활용한 수백 건 이상의 지반조사 데이터는, 이 과정 없이는 어떤 기술 기업도 5년 안에 복제할 수 없는 자산이다.
이 세 가지가 결합될 때 비로소 "엔지니어가 신뢰할 수 있는 AI"가 된다. 우리의 GeoAI Suite가 지반조사 자동화에서 96% 이상의 정확도를 달성한 것은 LLM이 뛰어나서가 아니라, LLM이 하지 못하는 영역을 별도의 엔진이 보완하는 하이브리드 구조 덕분이다.
■ AI가 바꾸는 건설의 경제학
도메인 AI의 가치는 단순히 기술적 정확성에 그치지 않고, 산업의 경제 구조 자체를 바꿀 수 있다.
과거에는 깊은 도메인 문제를 소프트웨어로 해결하려면 수백억원의 개발비가 필요했다. 그래서 건설 IT 시장은 대형 SI 프로젝트 아니면 피상적 SaaS — 양 극단만 존재했다.
그러나 AI, 특히 LLM의 등장으로 개발비가 1/10로 떨어졌으며, 이제 비로소 깊은 도메인 문제를 경제적으로 풀 수 있는 시대가 열렸다.
300억원이 들던 문제를 30억원에 해결할 수 있다면, 그동안 "비용 대비 효과가 없다"며 방치되던 수많은 현장의 비효율이 해결 대상이 된다.
이것이 건설 AI의 진정한 기회다 — 새로운 기술을 도입하는 것이 아니라, 풀 수 없었던 문제를 풀 수 있게 되는 것이다.
■ 범용 AI 시대, 도메인 전문가의 역할
마지막으로 한 가지 질문을 던지고 싶다. GPT-5, Claude 4.6 등 범용 AI가 더욱 강력해지면 도메인 AI는 불필요해지는가? 필자는 이 질문에 '아니다'라고 답하고 싶다.
범용 AI가 올라올수록, 그 위에 얹힐 도메인 지식·데이터·규정의 가치는 더 커진다. 엔진이 아무리 강력해도 연료가 없으면 달릴 수 없다. 15,000건의 현장 데이터, 수천 페이지의 Rule-as-Code, 대기업 현장에서 검증된 워크플로우 — 이것들은 범용 AI가 스스로 만들어낼 수 없는 자산이다.
건설 산업에 AI를 도입하겠다는 것은, ChatGPT를 현장에 가져다 놓겠다는 뜻이 아니다. 현장의 문제를 정의하고, 그 문제에 맞는 AI 구조를 설계하고, 현장의 데이터로 검증하는 — 이 지난한 과정을 거쳐야 한다는 뜻이다.
기술이 아닌 문제에서 출발하는 것. 그것이 건설 AI의 첫번째 조건이다.