How Popular is kaggle in Africa?

1. Introduction

1.1 Introduction

800 사용자가 사용하고 있는 글로벌 온라인 커뮤니티 케글. 194개의 나라에서 사용중.

2017년부터 머신러닝과 data 과학자들을 대상으로 설문을 했는데, 본 저자는 아프리카 나라들의 참여를 알아보고자 한다.

Historical overview 이용




1.2 Table of Contents

  1. How does Africa compares with rest of the world?

    1. (Region(Q3)) 응답자 수(Africa/전체, 2021): bar-H
    2. (Region(Q3)) Africa에서 kgg사용증가 : bar
  2. Which African countries are kaggle-aware?

    1. (Q3) kgg을 사용하는 Africa나라 (2021): plotly_choroplethMap
    2. (Q3) kgg 사옹 증가 나라별 in Africa : heatmap
    3. (Q3) 조사에 참여한 나라 비율 in Africa (2021): Pie-Chart(donut)
  3. Demography : Age and Gender

    1. (Q1) age / (Q2) gender (Africa/전체, 2021): bar /bar-H
    2. (Q2, Q2, Q2, Q1, Genderselect) African 여성 비율 : bar
  4. Education, Jobs and Experience

    1. (Q4)학력/ (Q5)직업/ (Q6)경력 (Africa/전체, 2021): bar-H
  5. Programming Languages & IDE’s

    1. (Q7-13)프로그래밍 언어 선호 (Africa/전체, 2021): heatmap
    2. (Q9-13)IDE (Africa/전체, 2021): bar-H
    3. (Q8)추천 프로그래밍 언어 (Africa/전체, 2021): bar-H
  6. Machine Learning: Experience, Framework and Algorithms

    1. (Q15)Muchine Learning 경력 (Africa/전체, 2021): bar-H
    2. (Q16-18)Muchine Learning 플랫폼 (Africa/전체, 2021): bar-H
    3. (Q17-12)Muchine Learning 알고리즘 (Africa/전체, 2021): bar-H
    4. (Q18-7)computer vision Methods (Africa/전체, 2021): Heatmap
    5. (Q19-6)자연언어 처리방법 (Africa/전체, 2021): Heatmap
    6. (Q14-12)visualizations Library (Africa/전체, 2021): Heatmap
  7. Computing Resources

    1. (Q11)hardware platform (Africa/전체, 2021): bar-H
    2. (Q13)TPU 사용빈도 (Africa/전체, 2021): bar-H
    3. (Q12-6)특별한 하드웨어 (Africa/전체, 2021): Heatmap
    4. (Q27_A 12)온라인 플렛폼 (Africa/전체, 2021): bar-H
    5. (Q28)클라우드 플렛폼 (Africa/전체, 2021): bar-H
    6. (29_A, 5)클라우드 만들때 쓰는 기본 resource? (Africa/전체, 2021): bar-H
    7. (32_A, 12빅데이터 만들때 (Africa/전체, 2021): bar-H
    8. (Q33)가장많이 쓰는 big data 생성 프로그램 (Africa/전체, 2021): bar-H
  8. Employment and role at work

    1. (Q20) 최근 고용주 (Africa/전체, 2021): bar-H
    2. (Q24)일할때 중요한 활동 (Africa/전체, 2021): Heatmap
    3. (Q25) 급여 피라미드 (Africa/전체, 2021): dual bar-H
  9. Learning Platform and Media

    1. (Q40) data science 배우는 플랫폼 (Africa/전체, 2021): bar-H
    2. (Q42-12) 가장 좋아하는 DS Topics 미디어 소스 (Africa/전체, 2021): Heatmap
  10. Summary

  11. Reference

    특정 연도를 넣지 않은 부분은 historical data




2. Import

2.1 dataFrame & visualization Module

1
2
3
4
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pylab as plt

Numpy

dataframe

Pandas

dataframe

seaborn

Seaborn은 Metplotlib를 기본으로 생상테마와 통계용 차트 기능을 추가한 시각화 패키지

기본적인 시각화 기능은 Matplotlib, 통계는 Statsmodels에 의존한다.

Ref. seaborn tutorial/En


matplotlib

matplotlib.pyplot 모듈은 명령어 스타일로 동작하는 함수의 Library.

함수를 이용하여 그래프를 만들고, grid를 조정하고, Label도 꾸미는 등을 할 수 있다.

Ref. matplotlib.pyplot



2.2 plotly

1
2
3
4
5
6
7
8
9
10
11
12
13
14

import plotly.io as pio
import plotly.express as px
import plotly.graph_objects as go
import plotly.figure_factory as ff

from plotly.subplots import make_subplots #특정한 차트를 만들기 위해 넣어줌
from plotly.offline import init_notebook_mode, iplot #offLine에서도 돌아갈 수 있게 해줌

init_notebook_mode(connected=True)
pio.templates.default = "none"

# import plotly.offline as py
# py.offline.init_notebook_mode()

Plotly

plotly Livrary 전체를 pio로 받아옴.
그 중에서

를 받아 왔다.

  • plotly에서 G를 그리는 방법은 2가지가 있는다.
    • px : 템플릿을 통해 제작
    • go : 그래프를 하나하나 설정하며 제작

plotly_python

plolty-tutorial-guide/Ko

  • offline plotly

offline plotly

1
2
3
4
5
6
7
import os
for dirname, _, filenames in os.walk('/kaggle/input'):
for filename in filenames:
print(os.path.join(dirname, filename))

import warnings
warnings.filterwarnings("ignore")
  • data input 하는 방법.
    여러개의 csv file을 경로를 지정 해주어 한번에 넣어주는 code

1
2
3
4
5
df17= pd.read_csv("/kaggle/input/kaggle-survey-2017/multipleChoiceResponses.csv", encoding="ISO-8859-1")
df18= pd.read_csv("/kaggle/input/kaggle-survey-2018/multipleChoiceResponses.csv", )
df19= pd.read_csv("/kaggle/input/kaggle-survey-2019/multiple_choice_responses.csv", )
df20= pd.read_csv("/kaggle/input/kaggle-survey-2020/kaggle_survey_2020_responses.csv", )
df21= pd.read_csv("/kaggle/input/kaggle-survey-2021/kaggle_survey_2021_responses.csv", )

연도 별로 dataFrame을 씌워서 csv file을 dfyy객체에 Loading해 준다.

Author

YoonHwa

Posted on

2021-11-10

Updated on

2021-11-10

Licensed under

You need to set install_url to use ShareThis. Please set it in _config.yml.
You forgot to set the business or currency_code for Paypal. Please set it in _config.yml.

댓글

You forgot to set the shortname for Disqus. Please set it in _config.yml.