안녕하세요, 이대호 변리사입니다. 미국에서 구글의 Batch Normalization Layers 특허의 1차 거절이유가 공개 되었습니다. 작년 10월(정확히는 10월 31일)에 미국특허청이 1차 심사결과를 내놓았습니다.
Batch Normalization 특허는 저희가 딥러닝 특허 관련 세미나를 할 때마다 엔지니어 분들의 지대한 관심을 받는 특허입니다. 저희도 항상 심사 경과를 지켜보고 업데이트 드리겠다고 말씀드리곤 했었습니다.
미국 특허청의 1차 심사 결과를 보면, 소프트웨어 특허에 대한 거절이유 종합선물세트라고 부를만 합니다. 소프트웨어 특허에서 쟁점이 되는 문제들을 모조리 지적하는 한 편, Batch Normalization 특허의 진보성을 부정하는 선행기술을 14개 제시하였습니다. (1차 거절이유에서 명확하게 거론된 것은 7건, 특허 4건, 논문 3건) 통상적인 특허 거절이유에서 선행기술이 많아야 5개 내외로 제시되는 것을 고려할때 이례적으로 많은 수치입니다.
1차 거절이유통지서의 분량도 무려 58페이지에 달합니다. 저희가 실무를 처리하는 입장에서 판단할 때도 굉장히 꼼꼼하게 심사를 수행했다는 느낌이 듭니다.
먼저 일반적인 특허 제도에 대한 설명을 드려야 할 것 같습니다.
특허를 등록받기 위해서는 일단 특허를 받고 싶다는 신청서를 특허청에 제출하여야 합니다. 보통 이걸 특허 출원이라고 표현합니다. 특허 출원을 하였다고 해서 모든 출원이 등록을 받는 것은 당연히 아닙니다. 일종의 민원 신청이기 때문에 국가기관인 특허청에서 이를 심사하는 과정을 거치게 됩니다.
심사 결과 특허권을 줘도 괜찮다고 판단되면 특허권을 등록해 주겠다는 통지, 즉 등록결정서를 보내줍니다. 하지만 이런 경우(심사 결과 한 번에 바로 등록을 주는 경우)는 통계상 10% 정도에 불과합니다.
특허청이 심사한 결과 특허권을 주는 것이 부적절하다고 판단하는 경우(나머지 90%의 경우), 바로 거절하는 것은 아닙니다. 국가의 행정 처분 중에서 국민에게 불이익한 처분이므로, 그 근거를 명확하게 밝히고, 신청인이 여기에 대해 불복하거나 의견을 개진할 기회를 주어야 합니다. 그래서 바로 거절하는 것이 아닌 “특허청의 판단결과 특허권을 줄 수 없으니, 여기에 대한 의견을 개진하시오”라는 취지의 문서를 발송합니다. 한국에서는 보통 이걸 “의견제출통지”라고 부릅니다.
금번 미국특허청의 1차 거절이유 통한 이러한 절차에 해당합니다. 미국특허청이 판단한 특허를 주기 어려운 이유를 출원인에게 제시하는 절차입니다. 이제 신청인인 구글은 지정된 기간 내에 청구범위를 수정하거나 자신의 의견을 특허청에 제시할 기회를 갖게 됩니다.
이번 1차 거절이유에서 미국특허청이 구글측에 제시한 거절이유는 크게 아래의 3가지 이슈입니다. (거절이유로 제시한 것 이외에도, 소프트웨어 특허와 관련해서 쟁점이 될만한 이슈는 하나가 더 있긴 합니다. 괄호 안의 조항은 거절의 근거가 되는 미국 특허법 조문 번호입니다.)
1. 발명의 성립성 위반(35 U.S.C 101)
2. 신규성 위반(35 U.S.C 102)
3. 진보성 위반(35 U.S.C 103)
발명의 성립성 위반 이슈는 소프트웨어 특허와 관련해서 너무나 중요한 이슈가 되었습니다. 2014년에 미국 대법원 판례가 나온 이후, 소프트웨어 특허 등록이 한동안 정체되었을 정도로 아주 중요한 이슈입니다. 소프트웨어 특허를 작성할 때, 한국변리사가 특허 명세서를 작성하는 단계부터 해당 이슈를 회피하는 것 또한 너무나도 중요해 졌습니다. 해당 내용을 배경부터 설명하기에는 본 칼럼이 지나치게 길어질 것 같습니다.
딥러닝 핵심 알고리즘 관련 특허에 발명의 성립성 이슈가 제기된 것은 예사로운 일은 아닙니다. 앞으로 인공지능 관련 특허에 대한 미국 특허청의 스탠스를 짐작해 볼 수 있는 사건일지도 모르겠습니다. 해당 이슈는 별도의 칼럼으로 조만간 다루도록 하겠습니다.
2번 과 3번 즉 신규성과 진보성 관련 이슈는, 흔히들 잘 알고 계시는 특허가 거절되는 일반적인 이유입니다. 즉, 해당 특허 발명과 동일한 발명 혹은 유사한 종래기술이 존재하므로 특허를 줄 수 없다는 거절이유입니다. 신규성 위반(35 U.S.C 102)은 종래기술과 특허 발명이 동일한 경우에 해당합니다. 진보성 위반(35 U.S.C 103)은 종래기술들과 특허 발명이 유사한 경우에 해당합니다.
이번 칼럼에서는 미국 특허청에서 어떤 종래기술과 Batch Normalization 특허를 유사한 것으로 보았는지 여부에 대해서 살펴보도록 하겠습니다. 전체 내용을 다루기에는 내용이 방대한 관계로 가장 중요한 청구항 1항에 대한 쟁점만을 살펴보도록 하겠습니다.
구글의 Batch Normalization 특허의 청구항 1항은 아래와 같습니다.
청구항 1항은:
“A neural network system implemented by one or more computers, the neural network system comprising:
a batch normalization layer between a first neural network layer and a second neural network layer, wherein the first neural network layer generates first layer outputs having a plurality of components, and wherein the batch normalization layer is configured to, during training of the neural network system on a batch of training examples:
receive a respective first layer output for each training example in the batch;
compute a plurality of normalization statistics for the batch from the first layer outputs;
normalize each component of each first layer output using the normalization statistics to generate a respective normalized layer output for each training example in the batch;
generate a respective batch normalization layer output for each of the training examples from the normalized layer outputs; and
provide the batch normalization layer output as an input to the second neural network layer."
청구항 1항의 내용은 1) 제 1 레이어와 제 2 레이어 사이에 존재하는 BN 레이어가, 2) 제 1 레이어의 출력을 받아서 3) 해당 출력의 정규화 통계(평균 및 표준편차)를 연산하고, 3) 이를 기초로 제 1 레이어의 출력들을 정규화하고, 4) 이를 제 2 레이어의 입력으로 제공한다는 내용입니다. 우리가 알고 있는 Batch Normalization 의 기본 내용들이 제시되어 있습니다.
신규성 위반 이슈(35 U.S.C 102)
심사관은 해당 청구항 1항이 미국 특허 US5479576와 동일하기 때문에 등록을 받을 수 없다는 의견을 제시하고 있습니다.
해당 특허는 1992년에 일본에서 출원된 특허이니, 꽤나 오래된 기술인 셈 입니다. 미국 특허청에서 Batch Normalization 특허 자체의 특허성을 꽤나 부정적으로 보는 것처럼 보입니다.
US5479576 특허 중 Batch Normalization 특허와 관련되었다고 보는 부분은 도 14에 있는 내용과 다음과 같은 부분입니다. 도 14를 보시면 제 1 레이어(61)과 제 2 레이어(64)에 해당하는 부분이 있고, 여기서 제 1 레이어(61)의 출력들을 가지고 평균값에 대해 추론하는 네트워크(62)와 표준편차에 대해 추론하는 네트워크(63)가 존재합니다. 이렇게 추론된 평균값과 표준편차는 제 2 레이어(64)에 보내질 출력을 정규화 하기 위한 값 들로 쓰입니다.
여러분들은 어떻게 보시나요, 해당 특허를 자세히 살펴보면 저희가 알고 있는 Batch Normalization 의 원리와는 다소 동떨어져 있는 내용입니다. 다만 특허의 심사 과정은 청구항을 기준으로 기계적으로 이루어진다는 점을 간과해서는 안됩니다. 일단 구글의 Batch Normalization 특허 자체가 BN 레이어에 대해 아주 간략한 내용만을 청구항 1항에 적었기 때문에, 심사관은 그 간략한 내용과 유사해 보이는 종래기술을 가지고 오면 그만입니다. 그렇다면 구글은 왜 청구항 1항을 간략하게 적은 걸까요? 그 이유는 최대한의 권리범위를 얻기 위함입니다.
청구항이 간략하면 간략할 수록 권리범위는 넓어지지만, 심사관이 유사한 종래기술을 찾기 쉬워지므로 거절당할 확률도 올라갑니다. 특허의 등록과정은 이러한 trade-off 관계 속에서 최대한 특허권자에게 유리한 쪽으로 청구항이 등록되도록 심사관을 설득하는 과정입니다. 청구항 1항의 내용만으로 등록이 어렵다고 판단되면 조금씩 종래기술에는 없는 추가적인 내용을 청구항 1항에 넣어서 등록을 꾀하게 됩니다.
제 사견으로는, 현재 구글의 특허 청구항 1항의 내용 자체가 US5,479,576 과 대응되는 부분이 있는건 사실이기 때문에, 구글이 청구항 1항을 수정하지 않고서는 그대로 특허를 등록받기는 쉽지 않아 보입니다.
다만, 구글이 청구항 1항을 수정해서 종래기술 US5,479,576 과 차이점을 인정받는다 하더라도 심사관이 진보성 관련 거절이유에서 제시한 나머지 6개의 특허와의 차이점 또한 인정받아야 한다는 점을 고려해야 합니다. 앞으로 구글을 대리하는 미국 변리사들이 무척이나 힘든 과정을 거쳐야할 것 같습니다.
저희같은 제3자로서는 다들 걱정하시는 바와 같이, Batch Normalization Layer를 넣는 모든 DNN들의 구글 특허 침해가 되는 우려는 다소 덜 수도 있을 것 같습니다. 물론 해당 특허가 넓게 등록받는다 하더라도, 지난번 오픈소스 라이선스 칼럼에서 말씀드린 바와 같이, Apache 라이선스에 따른 사용권을 획득할 수 있는 대안도 있지만요.
여러모로 구글의 대응에 관심이 갈 수 밖에 없겠습니다. 다가오는 몇개월 안으로 구글이 자신의 입장을 미국특허청에 전달할 것으로 보이는데요, 앞으로 구글의 대응도 모니터링해서 바로 알려드리도록 하겠습니다.
감사합니다.
이 칼럼을 준비하는 중에, 유럽 특허청에서 Batch Normalization 특허에 대한 등록결정을 내렸습니다. 미국과는 다르게, 청구항 수정이 거의 없이 등록되었습니다. 해당 청구범위에 대한 내용도 기회가 되면 리뷰해드리도록 하겠습니다.
본 칼럼에 사용된 특허에 대한 정보는 인공지능 기반 특허 분석 데이터베이스인 키워트를 사용하여 검색되고 제공되었습니다.