데이터 분석 언어 R, 인기 급상승 이유는?

데이터 분석에 주로 사용되는 컴퓨터 프로그래밍 랭귀지인 R의 인기가 급상승 하고 있어 눈길을 끈다. R은 SAS와 같은 고가의 통계 프로그램에 대한 대항마로 급부상했다가 머신러닝 언어로 파이썬이 인기를 끌면서 근래에는 인기가 주춤한 상태였었다.

그런데 상황이 달라졌다. 컴퓨터 프로그램 랭귀지 인기도를 측정하는 ‘티오베 인덱스(TIOBE Index)’에 따르면 R은 2020년 7월 전체 프로그램 랭귀지 중에 8위를 기록했다. 이는 역사상 R이 기록한 가장 높은 순위다.

놀라운 점은 불과 1년전 2019년 7월에 R의 순위가 20위였다는 점이다. 올해 1월만해도 18위에 불과했다. 2월부터 갑작스럽게 R의 인기가 올라간 것이다.

티오베 인덱스를 발표하는 티오베 측은 “얼마전까지만해도 통계분석을 위한 프로그래밍 전투에서 파이썬이 승리한 것처럼 보였지만, R의 인기는 파이썬 뒤에서 여전히 높아지고 있다”고 설명했다.

티오베 측은 R의 인기 급상승에 대해 두 가지 이유로 분석했다. 상용 프로그램 시대의 종말과 코로나19가 티오베가 분석한 R의 인기 상승 비결이다.

티오베 측은 “SAS, 사타나(Stata), SPSS와 같은 상업적 통계 언어와 패키지의 시대는 끝났다”면서 “대학과 연구소들은 파이썬과 R을 그들의 통계 분석 언어로 받아들이고 있다”고 설명했다.

그러나 대학과 연구소가 올해 들어 갑자기 상용 프로그램 대신 R과 파이썬을 도입하기 시작한 것은 아니다. 이미 수년 전부터 이와 같은 움직임을 계속돼 왔다. 이 때문에 올 상반기 갑자기 상승한 R의 인기 원인을 대학과 연구소에서 찾는 것은 무리가 있어 보인다.

티오베는 또하나의 원인을 코로나19로 분석했다. 회사 측은 “코로나19 백신을 찾기 위해 많은 통계 분석과 데이터 마이닝이 필요해졌다”면서 “그 결과 배우고 사용하기 쉬운 통계 프로그램(R)이 지금 인기를 얻었다”고 밝혔다.

C언어의 인기도 주목할만하다. C언어는 지난 5월부터 전체 프로그래밍 언어 인기도 1위를 3개월째 기록하고 있다. 지난 5년간 1위를 고수했던 자바는 2위로 내려갔다. 이에 대해 티오베 측은 C언어가 의료기기에 많이 사용됐기 때문이라고 분석했다. 코로나19로 인해 의료기기(장비) 수요가 높아진 덕분에 C언어의 활용처가 많아졌다는 것이다.

한편 2020년 7월 티오베 인덱스는 아래와 같다.(상위 20위)
1. C 언어
2. 자바
3. 파이썬
4. C++
5. C#
6. 비주얼 베이직
7. 자바스크립트
8. R 언어
9. PHP
10. 스위프트
11. SQL
12. Go
13. 어셈블리 언어
14. 펄(Perl)
15. 메타랩
16. 루비
17. 스크래치
18. 러스트
19. PL/SQL
20. 클래식 비주얼 베이직

글. 바이라인네트워크
<심재석 기자>shimsky@byline.network

관련 글

첫 댓글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다