(MIS)빅데이터 활용과 문제점- 정보격차 불평등과 공정성 논쟁을 중심으로
- 최초 등록일
- 2020.06.21
- 최종 저작일
- 2019.06
- 14페이지/ MS 워드
- 가격 2,000원
목차
1. 빅 데이터의 개념
2. 빅 데이터 분석에서 알고리즘 공정성 문제를 야기하는 요인
3. 빅데이터 정보격차에 대한 견해
4. 빅데이터 알고리즘 활용 사례와 문제점
1) 컴파스(COMPAS) 알고리즘은 흑백을 차별하는가
2) 예측적 치안유지는 편향적인가
3) 국경 관리 알고리즘의 위험 예측은 차별적인가
5. 결론
6. 참고문헌
본문내용
1. 빅데이터의 개념
빅데이터는 디지털 환경에서 생성되는 데이터로 그 규모가 방대하고, 생성주기가 짧고, 형태도 수치 데이터뿐만 아니라 문자와 영상 데이터를 포함하는 대규모 데이터를 말한다. 최근에는 우리 사회의 모든 곳에서 사람들의 데이터들이 형성되는데 이러한 데이터들을 종합하여 활용할 수 있는 것이다. ‘정보’는 4차 산업혁명의 핵심적인 요소인데 그러한 면에서 빅데이터는 4차 산업혁명의 핵심적인 부분이다.
빅데이터의 대표적 특성으로 3V(Volume, Variety, and Velocity)가 일반적으로 받아들여지고 있는데, 이를 이론적으로 설명하면 생성〮복제 및 유통되는 데이터의 부피(volume)가 기하급수적으로 증가하며, 유통되는 데이터 유형의 다양성(variety)이 크고, 실시간으로 데이터가 생성〮복제되어 유통속도(velocity)가 증가한다는 것이다. 3V에 대하여 예를 들어 설명하자면 다음과 같다.
1.1 부피 (Volume)
- 일반기업에서도 테라바이트(TB) ~ 페타바이트(PB)급 규모의 데이터를 다루는 경우가 증가
- 미국 기업 중 10TB를 넘는 분석 데이터를 확보한 기업이 1/3 이상
1.2 속도 (Velocity)
- 데이터 생성 후 유통되고 활용되기까지 소요되는 시간이 수시간~수주 단위에서 분, 초 이하로 단축
- 빈라덴 사살 소식이 트위터에서 1초당 5,000회 리트윗되며 확산
1.3 데이터 다양성 (Variety)
- 데이터마다 크기와 내용이 제각각이어서 통일된 구주로 정리하기 어려운 비정형데이터가 90% 이상을 차지
예) 동영상, 음악, 소셜미디어의 텍스트 메시지, 의료 진료기록 등
최근에는 위의 기존 3V에 진실성(Veracity), 시각화(Visualization), 가치(Value)의 3V가 새로운 빅데이터의 대표적 특성으로 추가되면서 6V가 생성되었다.
참고 자료
『인공지능 알고리즘은 사람을 차별하는가』, 홍성욱, 과학기술연구원
빅데이터와 알고리즘 시스템의 공정성 이슈
https://spri.kr/posts/view/18188?code=industry_trend
인종차별 데이터는 인종차별보다 더 무섭다
http://www.hani.co.kr/arti/science/scienceskill/882330.html
폭발하는 데이터
https://compassmag.3ds.com/kr/6/Cover-Story/node_1701
편견, 차별 부르는 AI 알고리즘… 해법은 있을까
http://www.hani.co.kr/arti/science/future/914757.html
인공지능은 인간을 차별하는가?
https://horizon.kias.re.kr/10971/