대구FC, K리그1 4월의 ‘팬 테이스티’ 팀 선정

대구FC가 4월 한 달간 팬들에게 가장 재미있는 경기를 선사한 ‘팬 테이스티’ 팀으로 선정됐다.한국프로축구연맹은 축구데이터 분석업체인 인스텟의 자료를 토대로 4월에 열린 하나원큐 K리그1 전 경기에 대한 데이터 분석을 실시했다. 그 결과 대구가 ‘인스텟 지수’ 254점으로 1위를 차지했다.인스텟 지수는 인스텟이 세계 여러 리그에 공통적으로 적용하는 선수평가지표다.각 선수의 포지션에 따라 12개 내지 14개 항목의 평가점수들이 계산되며 해당 리그와 경기 난이도를 추가적으로 고려해 산출된다.대구는 4월에 치른 5경기에 경기당 △슈팅 수 18.4회 중 유효슈팅 7.2회 △카운터어택 중 21%를 슈팅으로 연결 △드리블 28회로 해당 부문에서 모두 1위에 올랐다.또 △페널티에어리어 내 패스성공률 49% △키패스 14개 △코너킥 4.4회 등 경기의 박진감을 더하는 여러 지표에서 상위권을 차지했다.2위는 250점을 얻은 전북 현대며 울산 현대(244점), 수원 삼성(237점)이 뒤를 이었다.신헌호 기자 shh24@idaegu.com

서울대 ‘옥시 가습기 살균제’ 보고서, 옥시 측 요청에 실험 데이터 배제… 연구부정행위

사진=세계일보 서울대가 옥시 가습기 살균제 독성 실험을 한 서울대 수의과학과 조 모 교수에게 "연구부정행위가 있었다"고 결론 내린 사실이 뒤늦게 전해졌다.서울중앙지방검찰청은 이 같은 내용이 담긴 서울대 연구진실성위원회의 결정문을 지난해 12월 건네받아 대법원에 제출했다.서울대 연구진실성위원회는 '조 교수가 연구데이터를 임의로 변경하거나 누락하고, 옥시 측 요청에 따라 실험 데이터를 최종 보고서에서 배제하는 등 연구부정행위를 저질렀다'고 판단했습니다.해당 조 교수는 지난 2011년부터 약 1년 동안 옥시 측 요청에 따라 가습기살균제를 흡입할 경우 폐 등에 미치는 독성에 대한 실험을 진행해 당시 최종 보고서에서 가습기 살균제에 의한 독성학적인 변화는 없다는 취지의 결론을 내렸다.하지만 서울대 연구진실성위원회는 "실험동물의 개체별 표시와 노출기간별 표시가 훼손돼 체중, 장기무게 등 측정·기록 오류가 상당수 발생했다. 실험군의 체중 감소가 없는 것처럼 작성했고 엑셀 기입자료와 수기 원자료가 모두 없었지만 임의로 체중을 기재했다"며 "(실험군을 2주간 노출한) 실험보고서에는 8개 항목에 걸친 혈액검사 결과가 기재돼 있었다. 하지만 최종보고서에는 5개 항목으로 축소해 기재하는 등 실험결과가 조작된 정황이 나타났다"고 밝혔다.가습기 살균제의 유해성을 숨기려 보고서를 조작한 혐의로 재판에 넘겨진 조 교수는 2심에서 '부당하게 데이터를 누락하거나 결론을 도출했다고 볼 수 없다'며 무죄 판결을 받은 바 있다.online@idaegu.com

<13>빅데이터로 보는 부동산시장

빅데이터의 전망은 국내·외를 막론하고 장밋빛이다. 세계 유수의 시장조사 업체는 빅데이터의 연평균 성장률을 30%대 수준으로 전망하고 있으며 2020년 시장 규모를 약 250조 원으로 예측했다.빅데이터의 또 다른 정체성은 바로 ‘분석’이다.주택 매매 시 관리비, 문화 및 편의시설, 교통 등 빅데이터 항목을 면밀히 분석해 소비자는 어렵지 않게 최상의 주거 입지를 선택할 수 있다.부동산 빅데이터는 주택 관련 단순 정보제공과 현 시세정보를 뛰어넘어 지역별 주택 가격 예측과 각종 금융 계산 등 영역에까지 활용도를 높이고 있다.부동산의 가장 큰 자산은 경험, 곧 데이터다. 빅데이터를 활용하면 시세 차, 역·학세권 정보부터 인구분포, 유동인구 등 사항을 면밀히 분석해 소비자 니즈에 맞는 금액을 확인할 수 있다.부동산과 빅데이터의 융합은 고무적인 행보를 보인다. 공공데이터를 활용해 소비자가 집 주소와 전용면적, 공시가격 등을 입력하며 최저 수준의 법무사 비용을 알려준다. 한 숨 돌린 모양새다. 정부의 부동산 규제강화가 일정부분 먹혀 들어가는 형국이다. 아쉬운 대목은 경기지수는 여전히 불황의 늪을 면치 못하고 있다. 버블(거품)이 빠진 대신 경기 불황으로 인한 ‘하향 안정세’가 고착화돼가는 실정.우리나라뿐 아니라 부동산 시장의 냉각화는 전 세계적 추세로 점철된다.세계 경제의 중심인 미국 역시도 예외는 아니다. 주택시장의 둔화폭이 눈에 띄게 가파르다는 통계가 언론을 통해 이미 수차례 보도된 바 있다. 전년 대비 1.2%의 하락폭. 이는 2015년 이후 최저 수준이다.엎친 데 덮친 격으로 주택시장의 냉각화에 조소를 날리기라도 하듯 미국의 대출 금리는 최근 8년 새 최고치를 경신했다. 가계부채의 리스크를 담뿍 떠안게 된 모양새다.이 같은 침체 상황에서도 지방의 집값은 견고하다. 수도권의 부동산 침체로 주택자금은 자연스레 지방으로 옮겨갔다. 서울에 비해 규제가 크지 않고 가감폭도 상대적으로 덜하다는 방증인데 여기에 기인, 안전한 시세차익을 지방으로부터 기대한다는 심리가 십분 작용하고 있다.모든 산업군에서 100%란 존재하지 않는다. 그렇기에 그 어떠한 분야의 타고난 전문가라 할지라도 ‘단언’은 자제한다. ‘예측’이라 하고 그에 따른 ‘전망치’를 내놓는다. 특히나 절대적 확률이 없는 부동산 시장에서의 선견지명은 바로 ‘경험의 축적’이다. 이전 정부의 궤적과 그에 따른 버블 견제, 동향 파악, 연도별로 행해지는 주택·인구 조사, 인프라 체크 등 각고의 경험을 바탕으로 그제서야 신중에 마지않는 의견을 피력한다.경험은 곧 데이터로 이어진다. 지내온 궤적을 오롯이 담은 하나의 역사인 셈이다. 그 데이터가 4차 산업혁명을 만나 더 크고, 더욱 많은 용량을 담아내는 ‘빅데이터’로 업그레이드 돼 가는 과정, 이번 연재의 방점이다.빅데이터를 활용한 치밀한 시뮬레이션을 전개한다. 경기회전의 폭과 소비자 기대 지수, 기계 건설 수주액, 종합주가지수, 금융기관 유동성, 장단기 금리 차 등 선행지수를 되짚어 볼 필요가 있다. 이 역시도 수많은 경험치가 쌓인 빅데이터의 산출물이다.부동산과 빅데이터의 떼려야 뗄 수 없는 ‘초연결적’ 명분을 이번 연재를 통해 더불어 공감해 볼 필요성이 있다. ◆부동산과 빅데이터, 왜 하나로 보나부동산 플랫폼이 대세다. 4차 산업혁명의 아류라고 하기엔 그 물길이 거세다. 서두에서도 언급했듯 부동산의 가장 큰 자산은 경험, 곧 데이터다.국내 유수의 매매 플랫폼에서는 부동산과 빅데이터의 초연결을 공고히 해가고 있다. 수년 간 축적된 플랫폼 이용자들을 분석, 그들의 매매패턴과 서치 경로, 이전 실거래가 등을 빅데이터화해 이용객 확보에 주력하고 있다. 이를 통해 전국단위의 시세 차, 주거의 최고 메리트로 일컬어지는 역·학세권 정보부터 인구분포, 유동인구 등의 사항을 면밀히 분석, 소비자 니즈에 맞는 금액설정과 그에 따른 최선 또는 차선의 주거확보에 브릿지 역할을 한다.주거 매매에도 ‘간소화’ 바람이 불고 있다. 더 이상 부동산 이곳저곳을 전전하며 발품을 팔 노력을 하지 않아도 되는 시대다. 이 역시 빅데이터의 활용에 기인한다. 이른바 ‘개인 맞춤형’ 서비스인데, 소비자가 원하는 지역과 주거요건 등을 그간 플랫폼서 구축된 알고리즘을 활용, 금액과 주거형태를 빅데이터화된 정보로 추출한 후 소비자에게 공개하는 형태다.과거 비슷한 조건과 금액을 제시해오던 여타 소비자들의 선택 사양 등을 다양화해 취사선택을 더욱 용이하게 한다. 여기에 그치지 않는다. 빅데이터를 통해 매일, 매주, 매월 업데이트화된 각 지역별 주택동향과 시세 등을 플랫폼 소비자들에게 오픈함으로써 합리적인 주택 매매의 길라잡이 역할을 톡톡히 하고 있다.빅데이터의 또 다른 정체성은 바로 ‘분석’이다. 분석의 명분은 객관적 기준 제시에 있다. 주택 매매 시 관리비, 문화 및 편의시설, 교통 등의 빅데이터 항목을 면밀히 분석, 소비자는 어렵지 않게 주거 선택 간 최상의 입지 항목을 비교·분석할 수 있는 장이 펼쳐진다.다른 것은 차치하더라도 전국의 아파트 시세 비교에 주력하는 플랫폼 역시 성행 중에 있다. 이 역시 빅데이터가 큰 비중을 차지하는데, 아파트의 평형 대, 난방 방식, 주변 상권, 교육 등의 정보를 소비자에게 적극 제공함으로써 소비자는 별 다른 인적 소모 없이 자신에게 맞는 주택을 다양한 패턴으로 견지해볼 수 있다.빅데이터의 정보는 ‘양’보다는 ‘질’을 우선시 한다. 많은 양의 정보가 아닌, 섬세한 분석을 통한 소비자 니즈에 맞춘 ‘핀셋 정보’를 제공한다는 점에서 빅데이터와 부동산의 만남은 가히 필연으로 보인다. ◆빅데이터 전망은 장밋빛부동산은 민법상 유체 물 및 전기 기타 관리할 수 있는 자연력으로서, 이 물건의 범주 안에 들어가는 것들 가운데 토지 및 그 정착물을 뜻한다. 시쳇말로 ‘신의 영역’이라고 불릴 만큼 부동산에 관한 예측은 전문가조차도 쉬 정의 내림을 꺼려한다. 우리나라에서는 부동산이 최고의 재테크 사업으로 인식돼 있다 보니, 전 산업군을 통틀어 정부 규제가 가장 강력한 시장 중 하나다. 상황이 이렇다 보니 부동산의 가치는 정부 정책과 그 궤를 함께한다.일부 호사가들에 의하면 부동산의 정체성을 두고 ‘종이 한 장’이라고 표현하는 경우가 왕왕 있다. 바로 ‘투자’와 ‘투기’의 개념인데 내 집 마련에 대한 다각도의 투자와 ‘그래도 부동산은 움직이지 않는다’는 암묵적 믿음 사이에서 안정성을 담보한 최고의 돈벌이 수단으로 여기는 부류 역시 심심찮게 만나볼 수 있다. 부동산의 ‘폐쇄성’이 이 같은 외줄 타기를 조장한다는 주장이 힘을 얻는 대목이다.빅데이터란 앞선 연재서도 다뤘듯이 기존 데이터베이스의 관리능력을 초과. 정형, 반 정형, 비 정형 데이터 전체를 통칭한다. 3V의 아이덴티티를 지닌 빅데이터는 데이터 크기(Volume), 처리속도(Velocity), 다양성(Variety)의 요소를 아우르고 있다.빅데이터의 전망은 국내·외를 막론하고 장밋빛이다. 2012년 약 50억 달러에 그친 빅데이터 관련 기술·서비스 사업군이 올해 200억 달러 가까이 성장할 것으로 전망되고 있다. 여기에 파생될 일자리 역시 500여 만 개에 이를 정도로 빅데이터의 파급력이 그 어느 때보다 높은 상황. 세계 유수의 시장조사 업체에서도 빅데이터의 연평균 성장률을 30%대 수준으로 전망하고 있으며, 2020년 시장 규모를 약 250조 원으로 예측했다.국내는 또 어떨까. 현재 대한민국의 빅데이터 시장은 연평균 11%에 이를 만큼 높은 성장세를 보인다. 이 같은 추세가 유지된다면 2022년 국내 빅데이터 시장 규모가 2조2천억 원에 육박할 것이라는 전망이 나오고 있는 상황. 이와 더불어 데이터 전 과정을 아우르는 글로벌 데이터스피어(Datasphere)가 지난해 33제타바이트에서 2025년에 이르러 175제타바이트까지 폭증할 것이라는 견해가 중론이다. ◆빅데이터, 부동산계의 블루오션부동산과 빅데이터는 분명 개별의 성질을 가진 다른 분야지만 향후에는 ‘부동산 빅데이터’라는 고유어가 어색하지 않을 것이라는 전망이 나오고 있다. 그만큼 부동산과 빅데이터는 공생을 넘어 ‘하나’라는 공식이 더욱 옳을 듯하다. 오죽했으면 “가장 예측할 수 없는 부동산 시장의 유일한 예측 수단이 바로 빅데이터일 것”이라는 이야기가 나돌고 있으랴.국내 부동산 빅데이터는 또 다른 서비스 개시에 열을 올리고 있다. 주택 관련 단순 정보제공과 현 시세정보를 뛰어넘어, 지역별 주택가격 예측과 각종 금융 계산 등의 영역에까지 빅데이터의 활용도를 한껏 제고하고 있다.빅데이터는 이미 부동산 업계에서 ‘블루오션’으로 통하고 있다. 수십 번 강조해도 모자랄 데이터의 중요성을 업계 누구랄 것 없이 공감하기 때문으로. 소비자들 역시 사람의 통계보다는 빅데이터의 체계적 커리큘럼을 응당 더 신뢰하는 이유에서다.부동산 빅데이터는 향후 ‘예측’의 기술력에 따라 호불호가 극명히 나뉠 것으로 보인다. 전국의 5만여 아파트 단지의 과거 가격 폭과 변동사항, 유동인구와 그에 따른 사유 등을 빅데이터화해 예상 금액 등을 반추해 내는 것이다. 소비자는 이를 바탕으로 매매의 최적기를 제공받게 된다.공공영역에도 부동산과 빅데이터의 융합은 고무적인 행보를 보인다. 공공데이터를 활용, 소비자가 집 주소와 전용면적, 공시가격 등을 입력하며 최저 수준의 법무사 비용을 알려준다. 또 하루하루 갱신되는 채권매도단가의 수수료를 적용, 채권 가격을 자동으로 계산한다.동심동덕이라는 말이 있다. 같은 목표를 향한 일체된 마음을 뜻하는데 부동산과 빅데이터의 관계야말로 바로 이런 것이 아닐까 싶다. ‘내 집 마련’이 목표가 아닌 닿을 수 없는 꿈이 돼버린 ‘하우스 푸어’, 인고의 시간을 겪으며 자식들의 안위를 위해 한평생 몸 바쳐 온 소시민들, 이들에게 부동산이란 빅데이터의 명확하고 선한 시스템 아래 ‘기회’이자 ‘희망’이 돼 줄 것으로 믿어 의심치 않는다.글·사진 군월드 IT사업부김종윤 기자 kjyun@idaegu.com

동구청, 공공데이터 제공·운영 실태 평가서 1등급 선정

대구 동구청은 행정안전부 주관 ‘2018년 공공데이터 제공·운영 실태 평가’에서 1등급 관리 기관으로 선정됐다고 27일 밝혔다.동구청은 공공데이터 발굴을 위한 설문조사와 관련 교육, 인재육성과 활용 홍보 등 공공데이터 활용 노력 부분에서 높은 평가를 받았다.평가는 전국 17개 중앙행정기관 및 243개 지방자치단체를 대상으로 공공데이터 전면개방에 대한 범부처적 추진동력 확보를 위해 실시됐다.공공데이터 제공기반 조성, 제공현황 등 공공데이터 전 영역의 수준 등을 평가했다.김종윤 기자 kjyun@idaegu.com

기업 성장에 필수불가결 요소 ‘빅데이터’

과학기술정보통신부는 지난해 5월 대구디지털산업진흥원·영남대학교·한국교통안전공단·대구경북연구원 등 4개 기관을 빅데이터 전문센터로 지정했다.빅데이터는 기존 데이터베이스의 관리능력을 초과해 정형, 반정형, 비정형 데이터 모두를 아우르는 것을 통칭한다.최근 알파고의 업그레이드판 ‘알파고 제로’가 공개됐다. 알파고 제로는 바둑 뿐 아니라 체스, 장기에 이르기까지 인간계 챔피언을 물리쳤다.과거에도 거대한 양의 데이터 분석 기술은 존재했다. 바로 ‘슈퍼컴퓨터’인데 이를 활용해 많은 양의 데이터를 추출·축적해왔다빅데이터의 대표적 활용분야는 인공지능과 머신러닝, 딥러닝으로 압축할 수 있다. 기록은 여러 함의를 내포한다. 추억의 편린일 수 있고 경험치 축적으로 최상의 커리큘럼을 제공하기도 한다. 기록은 또 다른 의미의 데이터다. 데이터 분석을 통해 불특정 다수 누구랄 것 없이 유용한 기록을 전파한다.데이터에 관한 가치는 시나브로 공감을 얻고 있다. 산업 분야를 망라하고 데이터에 의한 활용도가 높아지기 때문. 유수의 시장조사업체에 따르면 2022년을 기점으로 데이터 시장의 가치가 약 3천억 달러에 육박할 것으로 전망하고 있다.인공지능(AI)은 유토피아와 디스토피아의 이항 대립에도 향후 도래할 4차 산업혁명의 핵심으로 꼽힌다. AI의 매개체가 바로 데이터라는 것, 상기돼야 함이 마땅하다는 방증이다.빅데이터는 위에서도 언급했듯 거대한 양의 데이터를 분석, 심도 있는 각종 정보를 추출, 경제적 가치를 제고한다. 포털의 뉴스 검색, 소셜네트워크서비스(SNS), 은행의 금융거래 기록 등이 여기에 속한다. ◆빅데이터의 역사와 정의기록이 데이터라면 용어 그대로 데이터가 큰 것을 빅데이터라고 명칭한다. 세부적으로 들어가보면 기존 데이터베이스의 관리능력을 초과해 정형, 반정형, 비정형 데이터 모두를 아우르는 것으로 빅데이터라고 통칭한다.그렇다면 정형, 반정형, 비정형 데이터의 정의는 무엇일까. 우선 정형 데이터는 우리가 흔히 접하는 문자와 숫자 데이터로 이해하면 빠르다. 학점이나 개인 신상에 관련된 각종 수치 등을 정형화된 툴을 활용, 저장해둔 ‘가시적’ 성격을 띤다.반정형 데이터는 눈에 보이지 않는다. 대신 XML(컴퓨터 텍스트 구조 표시 시스템)과 HTML(웹 문서를 만들기 위한 웹 언어의 한 종류), 웹 로그 형태로 발현된다. 더욱 쉽게 설명하자면 원하는 정형 데이터를 취득하기 위한 숨은 데이터라고 보면 된다. 포털사이트나 홈페이지 등에 이 기술이 담겨있다.비정형 데이터는 용어 그대로 정형화된 툴이 없다. 툴이 없기에 연산은 불가능하되 형태는 다양하다. 동영상, 음성, 이미지 등이 비정형 데이터의 범주에 속한다. 데이터의 통상적 기준에는 벗어나지만 빅데이터의 범주로는 가치있는 데이터 형식으로 각광받고 있다.그렇다면 빅데이터의 시작은 과연 언제부터일까. 결론부터 얘기하면 정확한 시기를 꼭 집어내기에는 미흡한 부분이 많다. 데이터란 역사가 워낙 방대하기에 빅데이터 역시 데이터 발전간 산출물로 여기는 학설이 지배적이다. 하지만 데이터와 빅데이터의 경계는 엄연히 차별점을 둔다.물론 과거에도 거대 양의 데이터 분석 기술은 존재했다. 그것이 바로 우리가 흔히 들어 본 ‘슈퍼컴퓨터’인데 이를 활용해 많은 양의 데이터를 추출·축적해왔다.하지만 슈퍼컴퓨터가 진정한 의미의 빅데이터라고 정의하기엔 미흡한 부분이 있다. 슈퍼컴퓨터의 구입과 관리에 들어가는 수십억 원의 비용적 문제가 우선 발생한다. 이마저도 정부 차원의 활용만 가능, 높은 진입장벽으로 민간인의 접근을 허용하지 않았다.오늘날 빅데이터는 비용적 측면에서 과거와의 확실한 차별성을 둔다. 저렴한 비용으로 엄청난 데이터를 효율적으로 추출할 수 있다는 가성비의 영역에서다. 더욱이 영상 등 비정형 데이터를 분석할 수 있는 텍스트와 하둡(Hadoop) 등 기술들이 대두됐다.기업도 과거 대용량 데이터 분석에 소요됐던 금액과는 비견할 수 없을 정도의 적은 돈으로 필요 정보를 선택하고 기존 정보와의 적절한 통합을 통해 퀄리티있는 가치 전달에 최적화된 환경을 구축했다. ◆3V 아이덴티티를 지닌 빅데이터유튜브를 통해 니즈(Nees)에 맞는 영상정보를 취득한다. 페이스북으로 인맥관리와 더불어 추억을 검색한다. 카카오톡으로 내 사람에게 희소식을 전하는 것, 이 모든 것이 데이터로 구성되며 이는 고스란히 저장된다.빅데이터는 총체적으로 ‘3V’의 아이덴티티를 지닌다. 여기서 3V란 데이터 크기(Volume), 처리속도(Velocity), 다양성(variety)의 요소를 함축한다. 크기라 함은 저장되는 데이터의 양, 속도는 초고도화 한 실시간 처리, 다양성이란 여러 형태의 데이터를 내포한다.빅데이터의 메리트는 많은 데이터를 분석해 정형화된 패턴의 도출이다. 하지만 여기에는 맹점이 있다.제아무리 빅데이터 기술이 발전했다손 치더라도 데이터양이 방대할수록 오류 데이터 산출이라는 리스크 역시 간과해선 안 된다. 이를 두고 일각의 전문가들은 3V가 아닌 6V를 주창한다. 여기에는 정확성(Veracity)과 가변성(Variability), 시각화(Visualization)를 포함한다.SNS의 확산으로 개인의 주장을 특정 매체의 도움 없이 피력하고 여론화할 수 있는 지름길이 열렸지만 의도와 다른 맥락 이해로 본래 주장이 폄훼되고 왜곡됨을 경계해야 한다. 이와 더불어 필요에 의해 취사선택 된 정보를 가공의 과정을 거쳐 가시화되는 빅데이터의 특성상 정보 이용자들의 용이한 접근이 요구된다. 정보 가공을 위해 공들인 여러 경제적 비용이 한낱 무용지물로 전락됨을 우려할 필요가 있다. ◆실수는 줄이고 장점은 극대화하자모든 산업군이 데이터의 영향을 받는다. 수많은 기록과 이에 따른 데이터 분석으로 실수를 고찰하고 장점을 극대화하는 작업, 전 방위적으로 빅데이터의 활발한 활용사례가 생겨남에 따라 이에 대한 예시를 특정하기에도 어려울 지경이다.빅데이터가 신변잡기적 일상마저 변모시키고 있다. 금융 간 빅데이터의 활용으로 보험료 절감과 노후대책 수립 간 지렛대 역할을 한다. 범죄 이력 등을 빅데이터화 해 성범죄와 보이스피싱 등 각종 범죄 피해에 선제적 대응을 할 수 있다.빅데이터의 대표적 활용분야는 인공지능과 머신러닝, 딥러닝으로 압축할 수 있다. 쉽게 풀어보자. 인공지능은 머신으로부터 인위적으로 만든 지능, 머신러닝은 기계학습으로 통칭한다. 컴퓨터 학습 간 알고리즘 개발의 한 분야라고 정의된다. 딥러닝은 말 그대로 깊은 학습, 이는 곧 심층학습으로도 일컫는데 데이터 추출을 사람이 하지 않고 기계 차원으로 학습하고 저장하는 프로그램이다.각 농가는 수익성 향상을 위한 데이터 플랫폼을 구축, 컨설팅 시스템 도입에 열을 올리고 있다. 특히 하릴없이 피해를 입는 구제역 등의 각종 가축질병에 선제적으로 대응하기 위한 방역전산시스템의 초고도화가 이 플랫폼의 핵심이다. 식당 창업을 돕는 인기 프로그램에도 성공을 위한 다양한 상권, 가격, 메뉴 등의 데이터를 수집하고 분석하는 것이야말로 창업의 선제적 요건으로 강조하고 있다.빅데이터는 스포츠와도 깊은 연관을 가진다. 모든 종목이 그렇겠지만 특히 야구는 ‘기록의 예술’로 종종 표현되곤 한다. 야구를 직접 관람을 하지 않더라도 선수 기록만으로 경기의 일정 부분을 머릿속에 그려볼 수 있다. 기록과 숫자의 데이터로 발현되는 통계의 스포츠가 바로 야구이기 때문이다.생명을 다루는 의료계에서의 빅데이터는 필수 사항으로 자리 잡았다.AI가 신생아의 동선을 분석, 뇌성마비 등 각종 질병 여부를 진단한다. 진단 영상은 ‘머신러닝’ 기술로 저장 후 학습, 빅데이터화 한다. 정확도는 100%에 가깝다. 학습사례가 잦아질수록 정확도는 더욱 견고해진다.각종 재난사고로 몸살을 앓고 있는 대한민국. 피해 최소화를 위한 재난 예측가능성을 제고하는 데도 빅데이터는 가장 유용한 기술력으로 평가되고 있다.국립재난안전연구원에 따르면 ‘지진해일대응시스템’의 구축으로 지진 발생 후 해일 등이 육지에 도달하는 시간과 최대 파고를 예측한다. 예상 파고가 접수되면 침수 예상범위를 시뮬레이션화 할 수 있고 시민들의 대피 중 파생 가능한 변수 등을 사전에 방지, 피해를 절감할 수 있다.한국은행 역시 빅데이터 영역을 전담할 ‘빅데이터통계연구실’을 가동, 소셜미디어에서 파생될 다양한 변수 등을 경제지표 상 접목 가능성에 대한 시뮬레이션을 진행하고 있다. ◆빅데이터 기반 ‘AI 산유국’이 되자빅데이터는 21세기의 석유로 대변된다. IT강국인 우리나라는 빅데이터의 발전으로 ‘AI 산유국’으로 발돋움할 공산이 크다. 자원이 부족한 대한민국에서 빅데이터야말로 핵심자원으로의 메리트를 충족할 수 있는 최적의 기술력이다.전 세계적으로 빅데이터 시장의 성장률은 고무적이다. 2012년 약 50억 달러에 그친 빅데이터 관련 기술·서비스 사업군은 2015년 170억 달러 가까이 성장했다. 여기에 파생될 일자리 역시 500만 개에 이를 정도로 빅데이터의 파급력이 그 어느 때보다 높은 상황.세계 유수의 시장조사 업체에서도 빅데이터의 연평균 성장률을 30%대 수준으로 전망하고 있으며 2020년 빅데이터 시장규모를 약 250조 원으로 예측했다.국내 역시 빅데이터의 장밋빛 미래가 점쳐지고 있다.현재 국내 빅데이터 시장은 연평균 11% 고성장률을 보이고 있다. 이 추세가 지속된다면 오는 2022년 국내 빅데이터 시장규모가 2조2천억 원에 육박할 것이라는 전망이 나오고 있는 상황이다.데이터 전 과정을 아우르는 글로벌 데이터스피어(Datasphere)가 지난해 33제타바이트(ZB)에서 2025년에 이르러 175제타바이트까지 폭증할 것이라는 견해가 중론이다.선견지명과 지피지기로 대변되는 미래예측의 수단 빅데이터. 산업간 실수를 줄여 손해를 최소화한다는 점에서 필수불가결한 시스템임은 부정할 수 없지만 빅데이터는 기본적으로 인과와 상관관계로의 예측을 기본으로 한다.경험치에 의한 정확도 제고는 될지언정 절대적 기준에는 다소 못 미치는 것 또한 사실이다. 빅데이터의 팩트적 요소를 강화하자면 시나브로 변모하는 사회적 상황과 각 산업의 고유성을 인정, 이를 바탕으로 ‘핀셋 컨트롤화’할 수 있는 또 다른 능력이 요구된다.글·사진 군월드 IT 사업팀김종윤 기자 kjyun@idaegu.com

시민이 참여하는 빅데이터센터 들어선다

시민이 참여하는 ‘빅데이터 활용센터’가 구축된다. 빅데이터 센터는 지역 데이터를 개방해 시민과 함께 도시문제를 해결하는 역할을 할 것으로 기대된다.대구시와 대구디지털산업진흥원(이하 DIP)은 올해 상반기 내로 빅데이터 활용센터를 구축할 계획이라고 11일 밝혔다.5억 원을 투입해 DIP 건물 5층에 조성된다. DIP가 위탁 운영한다.빅데이터는 혁신성장과 4차 산업혁명의 핵심 분야로 활용가치가 점차 높아지고 있다. 하지만 시민·기업·학생 등은 지역 빅데이터에 대한 인식이 부족하고 데이터 확보와 분석 인프라에 대한 접근이 제한적인 상황이다.이에 시는 2017년 12월 ‘대구시 빅데이터 활용에 관한 조례’를 제정하고 이를 기반으로 센터 구축에 나섰다.센터는 데이터 기반의 행정과 산업혁신 모델을 발굴·확산시킬 수 있는 환경을 조성하고 시민과 함께 도시문제를 해결할 수 있는 사회적 가치 창출의 전진기지로 활용된다.센터를 통해 빅데이터를 민간에 개방함으로써 시민의 접근성을 높이고 지역기업과 연구소 등에 데이터 기반의 부가가치를 창출할 수 있도록 돕는다.센터는 크게 빅데이터분석실, 오픈랩 등으로 구성된다.빅데이터분석실은 대구시 자체 행정망에 있는 폐쇄망 기반의 데이터를 제공하고 분석툴을 통해 한눈에 볼 수 있도록 분석하는 역할을 담당한다.오픈랩은 창업자가 상주해 연구하고 빅데이터 관련 전문가 세미나, 오픈 특강 등을 통해 시민의 빅데이터 인식을 높이고 지역 업체의 참여를 유도한다.지역기업의 빅데이터 활용서비스 개발과 리더기업을 육성하기 위한 지원도 이뤄진다. 이를 통해 빅데이터 활성화를 위한 민·관·산·학이 상생 협력할 수 있는 환경을 만든다는 계획이다.또 지역 빅데이터 공급과 수요기업에 대한 실태조사를 진행해 빅데이터 정책 기초자료로 활용할 계획이다.대구시는 빅데이터 다양한 국비사업 확보를 통해 지역 빅데이터 활성화 거점의 역할과 비중을 확대할 계획이다.이승협 DIP 원장은 “올해부터 빅데이터 활용센터가 개소하는 등 각종 지원사업이 본격적으로 진행되는 만큼 지역이 국내 빅데이터 분야를 선도할 수 있도록 최선을 다하겠다”고 말했다.김종윤 기자 kjyun@idaegu.com