본문 바로가기

분류 전체보기

(15)
파이썬의 자료구조 - 리스트편 1. 리스트 - 튜플과는 대조적으로 리스트는 크기나 내용의 변경이 가능하다. 리스트는 대괄호 []나 list 함수를 사용해서 생성할 수 있다. 리스트는 위와 같이 []를 이용하여 생성할 수 있다. 또한 리스트 안의 값을 인덱스로 불러와 재 지정, 즉 리스트의 크기나 내용의 변경이 가능하다. - 리스트 함수는 이터레이터나 제너레이터 표현에 실제 값을 모두 담기 위한 용도로 자주 사용된다. - append 메서드를 사용해서 리스트 끝에 새로운 값을 추가할 수 있다. - insert 메서드를 사용해서 리스트의 특정 위치에 값을 추가할 수 있다. 값을 추가하려는 위치는 0부터 리스티 길이까지의 값이어야 한다. ** insert는 append에 비해 연산비용이 많이 든다. insert로 값을 추가하면 추가된 위치..
파이썬의 자료구조 - 튜플편 1. 튜플 - 튜플은 1차원의 고정된 크기를 가지는 변경 불가능한 순차 자료형이다. 튜플을 생성하는 가장 쉬운 방법은 쉼표로 구분된 값을 대입하는 것이다. 튜플 = 1,2,3 - 괄호를 사용해서 갑을 묶어줌으로써 중첩된 튜플을 정의할 수 있다. 아래 예제는 튜플의 튜플을 생성한다. nasted_tuple = (4,5,6,7),(9,10) - 모든 순차 자료형이나 이터레이터는 튜플 메서드를 호출해 튜플로 변환할 수 있다. tuple([1,2,3,4,5]) - 스트링 또한 튜플로 변환 가능 - 튜플의 각 원소는 대괄호 []를 이용해서 다른 순차 자료형처럼 접근이 가능하다. 파이썬의 순차 자료향 색인은 0부터 시작한다. - 튜플에 저장된 객체 자체는 변경이 가능하지만 한 번 생성되면 각 슬롯에 저장된 객체를 ..
Python 객체의 자기관찰 b = [1,2,3] b? 객체의 자기관찰( Intropection ) 이라고 한다. 만약 객체가 함수이거나 인스턴스 메서드라면 정의더이 있는 문서를 출력해 준다. def add_numbers(a,b): """ Add two numbers together Returns -------- the_sum : type of arguments """ return a + b 위와 같은 함수를 작성했다면 add_numbers? ?기호를 사용해서 문서를 출력해보면 위와 같은 형태의 문서가 출력 된다.
파이썬 커뮤니티 pydata : pandas와 파이썬 데이터 분석 관련 질문을 위한 구글 그룹 pystatsmodels: 통계 모델이나 pandas 관련 질문을 올리는 곳 numpy-discussion: numpy 관련 질문을 올리는 곳 scipy-user:일반적인 Scipy나 과학 계산 파이썬 관련 질문을 올리는 곳
NCS 빅데이터 NCS에서는 빅데이터 분석 기획 능력 단위를 다음과 같이 네 가지 요소로 구분한다 . * WBS NCS 능력단위 학습 모듈 학습 도메인 이슈 도출하기 분석과제 AS-IS 및 개선방향 작성 - 주어진 업무에 대한 문제점을 정의하고 빅데이터 분석을 통한 개선 방향 도출 - 문제점 및 이 에 대한 개선 목표가 포함된 빅데이터 요건 정의서 수립 분석목표 수립하기 분석목표정의서 확정 - 빅데이터 분석을 통해 얻고자 하는 목표를 정의한 분석목표 정의서 수립 프로젝트 계획하기 프로젝트 계획 설계 - 빅데이터 분석을 위한 예산, 소요기간, 현재의 IT 환경 등을 고려하여 WBS ( Work Breakdown Structure ) 설계 보유데이터 자산 확인하기 내 외부 데이터 활용 수준 분석 및 컴플라이언스 점검 - 분..
빅데이터 요소 기술 빅데인터 요소 기술은 한국정보화진흥원의 분류에 따라 빅데이터 수집, 저장, 공유, 처리, 분석 및 시각화로 구분된다. - 수집 데이터 원천으로부터 데이터를 검색하여 수동 또는 자동으로 수집 단순 수집이 아닌 검색, 수집 변환 과정 포함 ETL 작업 수행 크롤링, 로그 수집기, 센싱, Open API 등 - 저장 데이터 크기에 상관 없이 저렴한 비용으로, 데이터를 빠르고 쉽게 저장 병렬 DBMS, Hadoop, Nosql 등 - 공유 시스템 간의 데이터 공유, Multitenanat 데이터 공유, 협업 필터링 등 - 처리 대용량 데이터 저장, 수집, 관리, 유통, 분석 과정 처리 분산병렬, 실시간, 인-메모리(In - Memory, 메인 메모리 데이터 저장) 처리 등 - 분석 데이터를 효율적이고 정확하게 ..
"Big" 데이터 란 1. 빅데이터(Big data) 정의 - 기존 데이터베이스 관리 도구 능력을 넘어서는 대량( 수십 테라베이트, Terabyte)의 정형 또는 데이터베이스 형태가 아닌 비정형의 데이터( 텍스트 , 비디오, 사진 등 ) 집합까지 포함한 데이터로부터 가치를 추출하고 결과를 분석하는 기술( 빅데이터 분석 및 시각화 기술도 포함한 개념으로 이해 ) 2. 빅데이터의 특징 - Volume( 규모의 증가 ) → IT 서비스의 일상화로 디지털 정보량의 증가 → 데이터 집합의 크기가 Terabyte 에서 Petabyte로 증가 → 데이터 수집, 관리 , 처리 소프트웨어의 수용 한계를 넘음 - Variety( 다양성 ) → 로그, SNS, 위치, 구매, IoT 데이터 등 데이터 종류의 증가 → 텍스트, 멀티미디어 등 비정형..