Today We Learned

2018/07/06 Fri :sunny:

김슬 기자님 특강 : 데이터 분석으로 세상을 바꿀 수 있을까요?

  • 데이터 분석 : 배울 내용이 너무 많다 → 월급을 위해 배우기에는 쉽지 않음
  • 시빅해킹 : 공공문제를 해결하는 or 이야기하는 프로그램을 만드는 일
  • 오픈소스는 '공유'의 정신이 중요 : 내 것이 틀릴 수 있음 → 오픈소스를 공개하고, 검사받아야 함
  • 기존 프로젝트 사례
    • EXIF를 활용한 촛불집회 관련 분석
      • EXIF : 사진이나 영상 파일에 들어 있는 메타 정보 (카메라 종류/설정, 사진 찍은 시간 위치 등)
    • 결제 사례를 이용한 '존맛국회'
    • 헌법재판소 구성원 성향 분석
  • 기존의 잘못된 분석 사례
    • 여론조사 기관의 신뢰성 조사 : 실명으로 순위 공개를 하는 것은 위험함
    • Machine Bias : 흑인에게 불리한 판결을 내리는 시스템
    • How statistics lost their power : 왜 트럼프 지지자들은 경제 통계를 믿지 않을까?
  • 데이터 분석 시 Tip
    • 클러스터링 알고리즘 in 싸이킷런 예시 : 데이터/알고리즘 특성에 따라 분석 결과의 품질이 다름
    • 공공정보의 경우 : 정보공개 청구 제도, 정보 공개 센터(open.go.kr)를 잘 활용하자
      • 단, 공개된 자료가 이미지인 경우가 많음. 수기 작업이 필요함.
    • Open data day 행사 : 매년 3월 첫째주 토요일, 전 세계 곳곳에서 같은 날 열림
    • 사람은 객관적일 수 없음 : 객관성은 기계를 통해 확보해야 함.
    • 해커톤은 비추천 : 결과물로 완성된 소프트웨어의 유지보수가 되지 않음.
  • 추천 자료
    • 어쩌다 보니 통계학자 (책)
    • 신호와 소음 (책)
    • 통계학의 피카소는 누구일까 (책)
    • 성당과 시장 (책)

results matching ""

    No results matching ""