읽는 흔적-2013-09

1199 단어
읽는 흔적-2013/09
Andy [email protected] 2013/09/20-2013/09/23
2013/09/30
  • Analyzing Twitter Data with Apache Hadoop 시리즈 1, 2, 3
  • 노트: Analyzing Twitter Data with Apache Hadoop 시리즈 1, 2, 3

  • 2013/09/22
  • HBase: The Definitive Guide - CHAPTER 9 - Advanced Usage
  • 단조롭게 증가하는 시간 시퀀스 데이터 rowkey는 부하 불균형을 피하기 위해 어떻게 설계되었는가(모든 데이터가 같은region에 기록됨)
  • Salting
  • Field swap/promotion
  • Randomization


  • OpenTSDB/schema OpenTSDB는 상기 두 번째 방법Field swap/promotion을 사용하지만 metric ID가 불균형하면 불균형
  • [0, 0, -69, 77, 4, -99, 32, 0, 0, 1, 0, 1, 11, 0, 0, 2, 0, -7, 42]
     `-------'  `------------'  `-----'  `------'  `-----'  `-------'
     metric ID  base timestamp  name ID  value ID  name ID  value ID
                                `---------------'  `---------------'
                                    first tag         second tag
  • App Engine datastore tip: monotonically increasing values are bad

  • 2013/09/20
  • Observability at Twitter
  • Monday, September 9, 2013 | By Cory G Watson (@gphat) [19:11 UTC]
  • 노트 - 트위터 분포식 구조의 관찰성
  • 좋은 웹페이지 즐겨찾기