본문 바로가기
금융 정보

코로나 바이러스 사태가 진정되는 시점을 어떻게 알 수 있을까?_(부제:미국 사람들은 코로나 바이러스에 얼마나 관심이 있을까?)

by Project.HP 2020. 3. 22.

 

지난 포스팅에서 코로나 바이러스 사태가 잡히면 일단 현재의 경제상황과는 달라질 것이라는 말을 했었다.

 

그렇다면 과연 그 시점이 언제일까? 뉴스가 코로나가 사태가 진정되었다고 할때? 감염 추이가 눈에 보이게 확 줄어들었을때? 사망자가 감소세에 이를때?  그럼 뉴스가 나올때까지 기다려야 하는 건가? 라는 의문을 품다가, 문득 생각난 구글의 Flu Trends. 즉, '독감 확산 예측'. 2008년 구글이 공개한 서비스로, 당시 미 보건당국보다 2주나 먼저 독감유행을 예측했다고 떠들썩 하기도 했었다. 

 

그럼 코로나 바이러스에 대한 사람들이 얼마나 관심이 있는지도 구글 검색량을 통해 알 수 있지 않을까? 하는 생각이 들었다. 

 

그래서 찾아본 결과,

 

이렇게 사람들이 코로나 바이러스와 관련해 어떤 검색을 얼마나 많이 하고 있는지, 무엇을 검색했는지 볼 수 있었다!

 

뿐만 아니라, 

이렇게 특정 문장에 대한 관심도 변화 그래프도 보였다. 근데 이 그래프엔 특징이 있다. 비교를 위해 같은 검색문장을 90일, 30일, 7일로 바꿔가며 그래프를 보았다. (해당 그래프는 미국 기준이다. 나라 설정역시 가능하다.)

 

 

<90일간의 관심도 그래프>

 

<30일간의 관심도 그래프>

 

<7일간의 관심도 그래프>

차이가 보이는가? 같은 날짜인데, 그래프에 수치가 정말 현저하게 다르다! 

 

이게 어떻게 된 일인고 하니 '상대적'인 수치'로 인한 마법이었다. 절대값이 아니라.

 

따라서 이 그래프들의 결과는 <매일 코로나 증상>과 관계된 키워드를 <미국인>들이 점점 더 많이 찾아보고 있다는 것을 알 수 있다. 30일 그래프에서 수치가 100이었던 3월 18일자가, 7일 그래프에선 3월 21일에 비해 수치가 12밖에 되지 않았기 때문이다. 

 

그럼 상대적인 수치만을 알 수 있느냐? 하면 또 그건 아니다.

이렇듯 <실시간 인기 검색어>코너에 들어가면 각 날짜의 인기 검색어 순위와 횟수 역시 볼 수 있다. 

 

이런 자료들을 관찰하다보면, 일반 대중들의 공포심이 사그라드는 때를 수치로 확인할 수 있지 않을까. 코로나 바이러스와 관련된 검색량이 점점 줄어드는 때라던지, (지금은 일단 계속 상승중이다) 슬그머니 맛집이나, 좋은 까페, 여행과 관련된 검색량이 늘어나게 되는 때 말이다. 

 

 

직접 보러가고싶은 분들을 위해 ↓

 

Coronavirus Search Trends

지금 Google에서 Coronavirus Search Trends이(가) 얼마나 인기 급상승 중인지 알아보세요.

trends.google.com

 

 

※주의점※

 

Flu Trends는 미 보건당국보다 2주먼저 독감을 예측했다고 떠들썩했지만, 2011년 어떤 논문이 나오며 포브스와 타임즈는 "왜 구글 독감 트렌드는 실패했나”라는 제목의 기사를, 타임즈는 “구글 독감 트렌드의 실패가 보여주는 빅 데이터의 단점"이라는 기사를 쓰기도 했다. 

 

 

The Parable of Google Flu: Traps in Big Data Analysis

In February 2013, Google Flu Trends (GFT) made headlines but not for a reason that Google executives or the creators of the flu tracking system would have hoped. Nature reported that GFT was predicting more than double the proportion of doctor visits for i

science.sciencemag.org

그런데 이런 자극적인 제목을 뽑아냈지만 실제 진짜로 구글 독감 트렌드가 완전히 실패한게 아니다. 논문의 저자는 이렇게 말하고 있다.

"구글 독감 트렌드는 그 자체로 다른 전통적인 방법을 대체하도록 만들어졌다기 보다는 다른 방법을 보완하는 용도로 만들어졌습니다. 다른 감시 시스템과 마찬가지로, 이 데이터를 바탕으로 추가적인 실제 조사활동을 하기 위해 사용될 때 가장 유용할 수 있습니다." 

 

즉, 단독으로 이 수치를 막 맹신하지 말고, 다른 유용한 정보들과 함께 쓰였을때 신뢰성과 활용율이 올라간다는 거다. 

 

그러니 구글의 방대한 데이터를 활용할 분들은 이 점을 유념하며 참고하셨음 좋겠다.