회원 로그인 창


로그인 메뉴

따끈따끈! 신착 전자책

더보기

콘텐츠 상세보기
재현 가능한 빅데이터 과학 : 지속적 공정성에 관한 사례연구


SMART
 

재현 가능한 빅데이터 과학 : 지속적 공정성에 관한 사례연구

Ravi Madduri, Kyle Chard, Mike D’Arcy, Segun C. Jung, Alexis Rodriguez,Dinanath Sulakhe | 아진

출간일
2020-08-10
파일형태
PDF
용량
20 M
지원 기기
PC
대출현황
보유1, 대출0, 예약중0
콘텐츠 소개
목차
한줄서평

콘텐츠 소개

빅 바이오메디컬 데이터는 발견을 위한 흥미진진한 기회를 만들지만, 분석과 출력을 찾을 수 있고, 접근 가능하고, 상호운용 가능하며, 재사용 가능한 형태(FAIR)로 포착하기 어렵게 만든다. 이에 대응하여 데이터 라이프사이클 전체에 걸쳐 데이터와 코드를 쉽게 캡처하고 식별자를 할당하는 도구를 설명한다. 우리는 수 테라바이트의 엔코드 DNase I 과민성 사이트 시퀀싱 데이터로부터 삽입적 전사 계수 바인딩 사이트의 지도를 생성하는 다단계 분석을 포함하는 사례 연구를 통해 도구의 사용을 설명한다. 이 툴이 복잡한 작업을 자동화하고, 이해 가능하고 재사용 가능한 형태로 분석한 알고리즘을 캡처하며, 사용성이나 재현성을 훼손하지 않고 빠른 네트워크와 강력한 클라우드 컴퓨터를 활용하여 데이터를 신속하게 처리하는지를 보여 준다. 즉, 빅 데이터가 사용하기 어려운 데이터가 아님을 보장한다. 연구를 통해 접근방식을 평가하고, 참가자의 91%가 상당한 데이터 볼륨을 포함하는 복잡한 분석을 복제할 수 있음을 보여준다.

목차

제 1편 : MATLAB 기본편
1. MATLAB 기본사용편 003
1.1 MATLAB 시작하기 003
명령창(command Window)에서의 입력 005
도움말(Help)의 이용 007
1.2 입력 오류의 수정 008
계산의 중지 009
MATLAB 종료하기 009
1.3 연산과 변수의 할당 009
연산자 우선순위 011
내장함수 012
1.4 데이터의 표현 013
1.5 변수의 처리 015
변수 이름 015
clear 명령어 016
특수변수와 정수 017
whos 명령어 017
1.6 벡터와 행렬 018
벡터 018
행렬 023
스크린 출력과 억제 024
1.7 랜덤(Random)수와 복소수 025
랜덤 수 025
복소수 027
1.8 기호를 이용한 연산 028
기호식에서의 치환 029
1.9 코드 파일 030
스크립트 코드 파일 030
코멘트의 추가 032
함수 코드 파일 033
사용자 정의함수 036
1.10 간단한 그래프의 생성 037
ezplot을 이용한 그래프 037
plot을 이용한 그래프 039
3차원 그래프 042
1.11 MATLAB과 엑셀(Excel)의 접속 043
엑셀 데이터 불러오기 043
데이터 가져오기 옵션 046
스크립트 생성 옵션 049
함수 생성 옵션 049
생성된 데이터를 엑셀파일로 저장하기 050

제 2편 : 연구논문
Reproducible big data science: A case study in continuous FAIRness

1. Introduction 51
2. An atlas of transcription factor binding sites 52
3. Tools used in TFBS atlas implementation 55
4. A scalable, reproducible TFBS workflow 58
5. Recap: A FAIR TFBS workflow 63
6. Evaluating FAIRness and reproducibility 64
7. Discussion 66
8. Summary 69
9. References 70

한줄서평

  • 10
  • 8
  • 6
  • 4
  • 2

(한글 300자이내)
리뷰쓰기
한줄 서평 리스트
평점 한줄 리뷰 작성자 작성일 추천수

등록된 서평이 없습니다.