Nature Google Flu Trends.
Google Flu Trends.이것의 주된 이유는 Google 독감 트렌드가 인터넷에서 빅데이터를 사용했고.
The primary reason behind this was that Google Flu Trends used a big data on.
Google Flu Trends.Combinations with other parts of speech
이런 일의 예는 Ginsberg et al. (2009) (Google 독감 트렌드).
An example of this kind of work is Ginsberg et al.(2009)(Google Flu Trends).
Google Flu Trends.더 심각한 경우가 있는데요, 2013년에 있었던 Google 독감 트렌드 사례를 살펴 보겠습니다.
For a more serious case let's look at the Google flu trends case from 2013.
Google Flu Trends.Google 독감 트렌드는 유행성 독감을 유행시키기 위해 검색 데이터를 사용한 첫 번째 프로젝트가 아니 었습니다.
Google Flu Trends was not the first project to use search data to nowcast influenza prevalence.
Google Flu Trends.Google 독감 트렌드는 인플루엔자 유행을 nowcast하기 위해 검색 데이터를 사용하는 첫 번째 프로젝트 아니었다.
Google Flu Trends was not the first project to use search data to nowcast influenza prevalence.다행히도, Google 독감 트렌드와 이러한 문제는 고칠 수 있습니다.
Fortunately, these problems with Google Flu Trends are fixable.Google 독감 트렌드 뒤에 중요하고 영리한 트릭은 예측 문제에 측정 문제를 설정 하였다.
The important and clever trick behind Google Flu Trends was to turn a measurement problem into a forecasting problem.그리고, 시간의 기간 동안 Google 독감 트렌드는이 간단한 방법보다 실제로 더 나빴다 (Lazer et al. 2014).
And, over some time periods Google Flu Trends was actually worse than this simple approach(Lazer et al. 2014).Google 독감 트렌드라고하는이 프로젝트는 세계를 변화시키는 빅 데이터의 힘에 대해 자주 반복되는 비유가되었습니다.
This project- which was called Google Flu Trends- became an often-repeated parable about the power of big data to change the world.Nowcasting 구글 독감 트렌드의 예제를 가장 명확하게 설명 될 수있다.
Nowcasting can be illustrated most clearly with the example of Google Flu Trends.자연에 발표 된이 논문에 부분적으로 기초,Google 독감 트렌드는 빅 데이터의 힘에 대한 자주 반복 성공 사례가되었다.
Based in part on this paper, which was published in Nature,Google Flu Trends became an often repeated success story about the power of big data.그리고 일부 기간 동안 Google 독감 트렌드는 실제로이 간단한 접근 방식보다 더 나빴습니다 (Lazer et al. 2014).
And, over some time periods Google Flu Trends was actually worse than this simple approach(Lazer et al. 2014).구글 독감 트렌드는 집계된 구글 검색 데이터를 사용하여 현재 전 세계 독감 유행 수준을 거의 실시간으로 예측한다.
Finally Google Flu Trends uses aggregated Google search data to estimate current flu activity around the world in near real-time.연구원들은 시간이 지남에 따라 Google 독감 트렌드가 처음 등장한 것보다 덜 인상적이게하는 두 가지 중요한 제한 사항을 발견했습니다.
Over time, researchers discovered two important limitations that make Google Flu Trends less impressive than it initially appeared.이것은 아마도 사업을위한 성공하지만,오버 추정 독감 유행에 Google 독감 트렌드 발생 (Lazer et al. 2014).
This was probably asuccess for the business, but it caused Google Flu Trends to over-estimate flu prevalence(Lazer et al. 2014).즉, 모든 데이터, 기계 학습, 강력한 컴퓨팅 Google 독감 트렌드 극적 휴리스틱을 이해하는 간단하고 쉽게 능가하지 않았다.
In other words, Google Flu Trends with all its data, machine learning, and powerful computing did not dramatically outperform a simple and easier-to-understand heuristic.처음에는 매우 유망했지만 Google 독감 트렌드의 실적은 시간이 지남에 따라 감소했습니다 (Cook et al. 2011; Olson et al. 2013; Lazer et al. 2014).
Although it was initially very promising, the performance of Google Flu Trends decayed over time(Cook et al. 2011; Olson et al. 2013; Lazer et al. 2014).그림 2.6: Jeremy Ginsberg와 동료 (2009) 는 Google 검색 데이터와 CDC 데이터를 결합하여 인플루엔자와 유사한 질병 (ILI)을 유발할 수있는 Google 독감 트렌드를 만들었습니다.
Figure 2.6: Jeremy Ginsberg and colleagues(2009) combined Google search data with CDC data to create Google Flu Trends, which could nowcast the rate of influenza-like illness(ILI).Google 독감 트렌드에 대한 두 번째 중요한주의해야 할 점은 CDC의 독감 데이터를 예측하는 능력은 단기적인 실패 때문에 드리프트와 알고리즘 혼란의 장기 부패하는 경향이 있었다 것입니다.
The second important caveat about Google Flu Trends is that its ability to predict the CDC flu data was prone to short-term failure and long-term decay because of drift and algorithmic confounding.예를 들어이 장의 뒷부분에서 설명 하듯이 알고리즘 혼란은 Google 독감 트렌드 (2.4.2 절)의 점진적인 분석에 대한 설명 중 하나 였지만 Google 검색 알고리즘의 내부 동작은 소유권.
For example, as I'll explain later in this chapter, algorithmic confounding was one possible explanation for the gradual breakdown of Google Flu Trends(section 2.4.2), but this claim was hard to assess because the inner workings of Google's search algorithm are proprietary.첫째, Google 독감 트렌드의 성능은 실제로 독감 유행의 가장 최근의 두 측정에서 선형 외삽에 따라 독감의 양을 추정하는 간단한 모델보다 훨씬 더이었다 (Goel et al. 2010).
First, the performance of Google Flu Trends was actually not much better than a simple model that estimates the amount of flu based on a linear extrapolation from the two most recent measurements of flu prevalence(Goel et al. 2010).이 기능을 추가하는 것은 검색 엔진을 실행하는 경우 할 수있는 합당한 방법이지만이 알고리즘 변경은 Google 독감 트렌드에서 독감 유행을 과대 평가하는 건강 관련 검색어를 생성하는 효과가있었습니다 (Lazer et al. 2014).
Adding this feature is a totally reasonable thing to do if you are running a search engine, but this algorithmic change had the effect of generating more health-related searches which caused Google Flu Trends to overestimate flu prevalence(Lazer et al. 2014).제 2 장에서 우리는 Google 독감 트렌드는 항상-에 확률 기반의 전통적인 측정 시스템합니다 (CDC 인플루엔자 감시 시스템)와 빅 데이터 시스템 (검색어) 빠른 견적을 생산하기 위해 결합 방법을 살펴 보았다 (Ginsberg et al. 2009).
In chapter 2, we saw how Google Flu Trends combined an always-on big data system(search queries) with a probability-based traditional measurement system(the CDC influenza surveillance system) to produce faster estimates(Ginsberg et al. 2009).