모바일 오유 바로가기
http://m.todayhumor.co.kr
분류 게시판
베스트
  • 베스트오브베스트
  • 베스트
  • 오늘의베스트
  • 유머
  • 유머자료
  • 유머글
  • 이야기
  • 자유
  • 고민
  • 연애
  • 결혼생활
  • 좋은글
  • 자랑
  • 공포
  • 멘붕
  • 사이다
  • 군대
  • 밀리터리
  • 미스터리
  • 술한잔
  • 오늘있잖아요
  • 투표인증
  • 새해
  • 이슈
  • 시사
  • 시사아카이브
  • 사회면
  • 사건사고
  • 생활
  • 패션
  • 패션착샷
  • 아동패션착샷
  • 뷰티
  • 인테리어
  • DIY
  • 요리
  • 커피&차
  • 육아
  • 법률
  • 동물
  • 지식
  • 취업정보
  • 식물
  • 다이어트
  • 의료
  • 영어
  • 맛집
  • 추천사이트
  • 해외직구
  • 취미
  • 사진
  • 사진강좌
  • 카메라
  • 만화
  • 애니메이션
  • 포니
  • 자전거
  • 자동차
  • 여행
  • 바이크
  • 민물낚시
  • 바다낚시
  • 장난감
  • 그림판
  • 학술
  • 경제
  • 역사
  • 예술
  • 과학
  • 철학
  • 심리학
  • 방송연예
  • 연예
  • 음악
  • 음악찾기
  • 악기
  • 음향기기
  • 영화
  • 다큐멘터리
  • 국내드라마
  • 해외드라마
  • 예능
  • 팟케스트
  • 방송프로그램
  • 무한도전
  • 더지니어스
  • 개그콘서트
  • 런닝맨
  • 나가수
  • 디지털
  • 컴퓨터
  • 프로그래머
  • IT
  • 안티바이러스
  • 애플
  • 안드로이드
  • 스마트폰
  • 윈도우폰
  • 심비안
  • 스포츠
  • 스포츠
  • 축구
  • 야구
  • 농구
  • 바둑
  • 야구팀
  • 삼성
  • 두산
  • NC
  • 넥센
  • 한화
  • SK
  • 기아
  • 롯데
  • LG
  • KT
  • 메이저리그
  • 일본프로야구리그
  • 게임1
  • 플래시게임
  • 게임토론방
  • 엑스박스
  • 플레이스테이션
  • 닌텐도
  • 모바일게임
  • 게임2
  • 던전앤파이터
  • 마비노기
  • 마비노기영웅전
  • 하스스톤
  • 히어로즈오브더스톰
  • gta5
  • 디아블로
  • 디아블로2
  • 피파온라인2
  • 피파온라인3
  • 워크래프트
  • 월드오브워크래프트
  • 밀리언아서
  • 월드오브탱크
  • 블레이드앤소울
  • 검은사막
  • 스타크래프트
  • 스타크래프트2
  • 베틀필드3
  • 마인크래프트
  • 데이즈
  • 문명
  • 서든어택
  • 테라
  • 아이온
  • 심시티5
  • 프리스타일풋볼
  • 스페셜포스
  • 사이퍼즈
  • 도타2
  • 메이플스토리1
  • 메이플스토리2
  • 오버워치
  • 오버워치그룹모집
  • 포켓몬고
  • 파이널판타지14
  • 배틀그라운드
  • 기타
  • 종교
  • 단어장
  • 자료창고
  • 운영
  • 공지사항
  • 오유운영
  • 게시판신청
  • 보류
  • 임시게시판
  • 메르스
  • 세월호
  • 원전사고
  • 2016리오올림픽
  • 2018평창올림픽
  • 코로나19
  • 2020도쿄올림픽
  • 게시판찾기
  • 게시물ID : programmer_13732
    작성자 : 육갑잔치
    추천 : 0
    조회수 : 3709
    IP : 108.162.***.103
    댓글 : 15개
    등록시간 : 2015/10/08 04:35:59
    http://todayhumor.com/?programmer_13732 모바일
    파이썬 병렬계산 속도가 마음대로 안 나와요 뭘 해야할까요 ㅠ
    옵션
    • 본인삭제금지
    코드가 너무 길어서 다 올리긴 어려울 것 같아요.

    for i in range(100):
    데이터 읽기..

    nh = len(계산할 대상)


    # Multiprocessing -----------------------------------------------------------

    m = mp.Manager()

    out_q = m.Queue()

    print("Looking for galaxies inside {} halos".format(nh))

    pool = mp.Pool(processes=8) # I am using ATLAS, initializer=set_affinity_on_worker)

    for i in range(nh):

    pool.apply_async(mk_gal, args=(h.data[i], out_q, s.info, i, final_gal[i]))

    pool.close()

    pool.join()

    for i in range(nh):
    dictout.append(out_q.get(timeout=0.1))

    이런 식입니다.
    저기서 call하는 mk_gal은 "데이터 읽기"에서 읽은 numpy array를 사용하고요. 
    모든 process가 전체 데이터에 각각 접근하지만 읽기만 하고 변경을 하지 않기 때문에 shared memory로 사용하는 것으로 알고 있습니다.
    (전체 프로세서에 데이터를 복사할 만큼 메모리가 많지는 않아요 데이터가 좀 큽니다.)

    돌려보면.. 속도가 영 별로예요. 
    전체 코어는 48개이고 하이퍼쓰레딩은 꺼놓은 상태입니다.
    8코어를 기준으로 pool 없이 1코어 버전으로 돌릴 때랑 전체 계산시간이 비슷하고요 (빨랐다가 느렸다가 하는데 지금은 그정도로 느립니다. 아래 아래 캡쳐에 속도 변화가 나와요.) 
    top에서는 8 코어가 100%로 나오는데, htop으로 보면 시뻘겋게 나옵니다. 
    빨간색은 kernel thread를 나타낸다는데 그게 어떤 의미인지는 잘 모르겠네요ㅠ 
    여튼 kernel thread 비율이 많아지면 계산이 느릿느릿한 것 같더라고요. 
    Selection_041.png

    처음엔 cpu affinity 때문인가 싶어서 affinity 변경하는(사실 정확한 개념을 모르겠네요..) 것도 넣어봤다가, 그래도 변화가 없어서 
    아예 OPENBLAS를 지우고 ATLAS를 설치한 다음에 numpy를 다시 설치했습니다. lsof -p로 atlas 라이브러리를 쓰는 것도 확인했고요. 
    여전히 저 상태입니다. 

    코어를 16개 쓰면 top에서도 대부분 50% 언저리 값을 보여주고요, 8개씩 두 개를 돌려도 마찬가지입니다. 
    측정해보진 않았지만 체감상으론 루프를 나누어서 1 코어씩 8개로 돌리든 8코어로 1개를 돌리든, 혹은 (2*2, 2*4, 4*4, 2*16 ,...) 어떤 조합을 하든간에 결국 끝나는 시간에는 큰 차이가 없습니다. 서로 다른 프로그램 사이에서도 간섭이 생기고 속도가 느려진다는게 좀 신기하네요. 

    더욱 신기한건, 어젯 밤에 오랜만에 이 코드를 돌릴때는 바깥 루프 (100개짜리)가 첫번째는 엄청 빨리 돌았는데 점점 속도가 떨어졌습니다. 
    루프 한번 돌 때마다 텍스트 파일이 나오는데 파일 생성된 시간이 웃겨요. 처음엔 1분 간격이었다가 서서히 늘어나더니 나중에는 거의 20분이 걸리네요. 
    (순서는 129에서 63까지 거꾸로 갑니다. )
    처음 한 두 번은 데이터가 메모리에 있어서 그랬을 수 있지만, 그 뒤로는 데이터를 읽은 적도 없는데 이렇게 됩니다. 속도가 점차 느려지는걸 보면 메모리 캐시랑 상관 없을 것 같기도 하고요.. 아래에서 파일 생성시간 간격을 보시면 됩니다.
    Selection_043.png
    Selection_042.png
    속도가 점점 느려진다는 부분에서 메모리가 새는가 싶은데, 어디서 어떻게 찾아야할지 잘 모르겠네요.


    여러가지 의심스러운게 있는데, 한번 나열해볼게요. 
    1. 계산할때 전체 어레이에 여러번 접근합니다.  shared memory라서 프로세서별로 데이터를 복사할 필요는 없지만. 혹시 한 번에 한 프로세서만 접근할 수 있어서 여러 프로세서가 여러번씩 접근해야하면 서로서로 기다리는 일이 생기나요? 테스트해보려는 중인데 고쳐야할 부분이 많아서 우선 물어봅니다. 
    2. 이건 CPU affinity랑 관련된 것으로 알고있는데 (그래서 잘 이해를 못하는..) numpy가 몇몇 함수에서는 자체적으로 multi thread 계산을 한다고 들었습니다. BLAS 라이브러리를 무얼 쓰든 상관없이 무조건 일어나는 일인가요? 혹시 이것 때문에 내부적으로 thread끼리 코어를 두고 싸우는 중인 것인지..
    3. 바깥 루프를 100번 돌고, 1회 도는 동안 계산할 대상은 대략 100여개 됩니다. (nh ~ 100). 싱글 스레드로 계산하면 하나당 몇 초 정도 걸리는 것 같아요. 혹시 너무 작은 계산을 pool로 나누어서 오버헤드가 엄청 커진걸까요?
    4. 실질적으로 하나당 계산 크기는 좀 많이 차이납니다. 어떤건 1초만에 끝나기도 하고 어떤건 30초 정도 걸리기도 하고요. multiprocessing에서 한 프로세스가 작은 계산을 빨리 끝내면 같이 생성된 다른 프로세스가 계산이 끝나든 말든 먼저 끝난 프로세스는 다음 일을 받아가는게 맞나요?
    5. 어디가 병목인지를 알아보려면 무슨 짓을 해야할지요.. Python 문서에서 The Python Profiler를 읽어보아도 대단히 유용한 기능은 못 찾겠습니다. 
    예를 들어 메모리 접근하는데 시간이 얼마나 소비되는지, OS 가 thread를 만들고 없애고 옮기는데 시간이 얼마나 걸리는지, 뭐 그런 정보를 알아야할 것 같지만.. 
    본격적으로 프로파일링을 해본 적이 없어서 어떤 툴을 써야할지도 막막하네요..

    근 한달에 걸쳐 여러번 해결하려고 시도중인데 차도가 없어서 슬픕니다. ㅠㅠ
    SO 검색해서 나오는글은 다 읽어본 것 같네요. 물론 다 이해하지못해서 문제이지만... 엉엉

    이 게시물을 추천한 분들의 목록입니다.
    푸르딩딩:추천수 3이상 댓글은 배경색이 바뀝니다.
    (단,비공감수가 추천수의 1/3 초과시 해당없음)

    죄송합니다. 댓글 작성은 회원만 가능합니다.

    번호 제 목 이름 날짜 조회 추천
    23461
    로또 [2] 까망사투리 25/02/12 13:13 399 2
    23459
    C++ 입문전 초보자입니다. Qt / wxWidgets / FLTK 어떤 [6] OMG! 24/12/07 00:28 934 0
    23458
    [KOCCA] 2024 게임콘텐츠 제작지원 이용자평가 체험단모집 장파랑 24/11/26 16:56 918 0
    23457
    [한국콘텐츠진흥원] 2024 게임콘텐츠 제작지원 이용자평가 이용자 모집 장파랑 24/11/18 14:02 951 0
    23456
    [한국콘텐츠진흥원] 2024 게임콘텐츠 제작지원 이용자평가 이용자 모집 장파랑 24/10/28 18:24 1348 0
    23455
    논문 읽는 사람들을 위한 문서 번역 서비스 rWhale 24/10/10 13:06 1680 2
    23453
    로또번호 [2] 까망사투리 24/09/19 11:10 2308 2
    23452
    AI와 함께가는 코딩 업계 [1] 펌글 우가가 24/09/02 22:19 2554 9
    23451
    Switch문 도배된 2100줄 짜리 함수 [4] 펌글 우가가 24/08/26 22:37 2416 4
    23450
    개인정보 수집 없는 이미지 리사이즈 사라밍 24/08/23 20:31 1823 0
    23449
    디자인 패턴의 템플릿 메소드 패턴 실무 적용 사례 [1] 써니썬 24/08/23 16:47 1834 1
    23448
    TMDB API Key 얻을 때 동의하게 되는 면책 및 포기 조항 우가가 24/08/18 16:07 1840 1
    23447
    펌) 아무튼 개쩌는 번역기를 국내기술로 개발완료 했다는 소식 [1] 펌글 우가가 24/08/15 17:30 2106 2
    23446
    쿠팡 가격 변동 추적 알림 서비스 피드백 요청 (제발) 창작글펌글 애오옹 24/08/10 14:30 2054 0
    23445
    넥사크로 17.1 관련 [2] 본인삭제금지 나르하나 24/08/01 12:30 2042 0
    23444
    개밯자 의자에 머리받침 없어 [2] 까망사투리 24/07/25 13:32 2434 1
    23443
    안드로이드 EditText 리스너 연동 문의드립니다. - 해결됨 [1] 창작글 상사꽃 24/07/01 17:47 2305 2
    23442
    펌) 파이어폭스 엔진이 신인 이유 [1] 펌글 우가가 24/06/30 23:25 2908 2
    23441
    예전에는 함수 하나에 대한 기능에 고민을 많이 했는데.. ssonacy 24/05/21 09:45 2672 0
    23440
    c++ 에서 DB 쿼리문처럼 사용할 방법이 있을까요? [8] 상사꽃 24/05/19 11:10 2828 0
    23439
    쉬운 배터리 알림 창작글 언젠가아자 24/05/14 10:47 2962 0
    23438
    아후 서터레스 [1] NeoGenius 24/04/02 17:52 2646 1
    23436
    로또 [3] 까망사투리 24/03/11 15:53 3328 4
    23434
    copilot 기업유료버전 intelliJ에 붙여서 쓰고있는데 지리네요 안녕월드 24/02/22 00:15 3334 0
    23433
    코딩마을 대나무숲 [6] cocoa 24/02/20 14:50 3501 5
    23432
    (질문) 프로그래머분들은 싱글PC게임 레벨제한 풀수 있죠?? [23] 본인삭제금지 할배궁디Lv2 24/02/13 13:36 3510 1
    23431
    Freemium NeoGenius 24/02/13 13:23 2943 0
    23429
    부산에서 프로그래머 구인하는데 연봉 6천에서 8천 작은건가 [3] 폴팡 24/02/04 20:50 3853 1
    23427
    chatgpt? bard? [3] 별빛러브 24/01/25 06:24 3077 0
    23426
    Next.js로 만들어봤어요~ [2] 창작글 sonnim 24/01/24 12:52 3315 3
    [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [다음10개▶]
    단축키 운영진에게 바란다(삭제요청/제안) 운영게 게시판신청 자료창고 보류 개인정보취급방침 청소년보호정책 모바일홈