가방 뒷이야기

11377 단어 rstatsr
코드는 보통 주어진 언어의 패키지에 배치됩니다.포장은 일반적으로 어떤 포장 등록에서 목록을 나눈다: NPM fornode, 쪽지 상자.io는 녹슨 흔적을 나타낸다. R에 대해 이 등록표는 CRAN 또는 Bioconductor(대다수 경우)이다.
CRAN은 아카이브 패키지의 개념을 가지고 있습니다.즉, 가방의 명칭 공간(foo은 여전히 등록표에 있으나(다시 사용할 수 없음) 이 가방은 저장되어 있고 업데이트도 하지 않으며 검사도 하지 않는다는 것이다.
우리는 소프트웨어가 어떻게 방치되었는지에 대한 이야기를 거의 듣지 못했다.소프트웨어를 포기하는 가장 흔히 볼 수 있는 원인은 무엇입니까?

내 CRAN 아카이브
먼저, 내가 보관하고 있는 CRAN 패키지는 다음과 같습니다.
library(pkgsearch)
library(dplyr)
library(data.table)
library(tibble)
x = cran_events(releases = FALSE, archivals = TRUE, limit = 4000L)
res = lapply(x, function(w)
  tibble(pkg=w$name, maintainer=w$package$Maintainer))
df = rbindlist(res, use.names = TRUE, fill = TRUE)
df = as_tibble(df)
scott = filter(df, grepl("chamberlain", maintainer, ignore.case = TRUE)) %>%
  select(pkg)
scott
#> # A tibble: 16 x 1
#> pkg        
#> <chr>      
#> 1 rjsonapi   
#> 2 rdpla      
#> 3 seaaroundus
#> 4 crevents   
#> 5 etseed     
#> 6 rtimes     
#> 7 rsunlight  
#> 8 nneo       
#> 9 binomen    
#> 10 solr       
#> 11 enigma     
#> 12 alm        
#> 13 ropensnp   
#> 14 govdat     
#> 15 spoccutils 
#> 16 rgauges

분명히 나는 CRAN에 16개의 압축 파일 패키지를 가지고 있다.

고사
다음은 각 가방이 CRAN에 보관된 이유에 대한 간략한 이야기입니다.

  • spoccutils: 실용적인 기능 패키지로 다른 패키지spocc의 범위에 적합하지 않습니다.명칭을 바꾸다mapr.나는 코란의 이름을 바꿀 수 있을 것 같아, 응

  • rgauges: Gaug.es 사이트에서 API를 분석하는 고객입니다. 저희는 이 패키지를 시작하여 rOpenSci 사이트 방문자의 데이터를 수집합니다.결국 우리는 Gauger 사용을 멈추었다.그리고 이 가방을 유지하는 것은 의미가 없어서 보관되었다.

  • alm: Lagotto라는 유니버설 문장급 도량 웹 서비스 프레임워크의 클라이언트입니다.rOpenSci 초기에 우리는 문장급 도량 업무에 종사한 지역 사회와 밀접한 관계를 맺었다.만약 내가 잘못 기억하지 않았다면 Lagotto의 사용 속도가 느려지고 별로 쓸모가 없었을 것이다. 그래서 나는 유지보수를 포기했다alm

  • ropensnp: 이 서비스의 고객OpenSNP입니다.또 다른 SNP 데이터 출처가 있는데 한 패키지에서 이 데이터를 방문하면 좋을 것 같습니다.따라서 새로운 패키지 ((rsnps 가 OpenSNP 기능을 만들고 통합했으며 ropensnp 보관되었다.

  • solr: Apache Solr 데이터베이스 패키지 클라이언트입니다.어느 때, 그것은 중대한 오버풀을 얻었고, 나는 가방 이름을 solrium 로 바꾸기로 결정했다.

  • binomen: 이 가방의 목표는 분류 클래스/대상을 만드는 함수와 분류 데이터를 조작하는 함수입니다. 약간 dplyr와 같습니다.binomen에서 사상의 변화는 새로운 가방taxa에 자리잡았고 현재Zach Foster가 유지하고 있다.

  • nneo: NEON 데이터 API 고객입니다.어느 날, 나는 우연히 NEON사의 다른 사람들이 기본적으로 같은 소프트웨어 패키지를 만들고 있다는 것을 발견하고 나의 파일을 저장했다.

  • etseed: 분포식 키 값 저장소etcd와 상호작용하는 패키지입니다.데이터베이스를 위해 R 가방을 만들 때 나는 매우 흥분해서 내가 잃어버린 가방을 보았다.etcd에 익숙해진 후에 나는 내가 영원히 그것을 사용하지 않을 수도 있다는 것을 깨달았다. 그리고 어쨌든 R과 etcd의 상호작용은 의미가 없을 수도 있다.

  • crevents: Crossref 조폐공장은 학술 문장(및 기타 작품)에 사용된다.그들은 깔끔한 서비스를 시작해서 DOI의 '이벤트' 를 수집하고 검색했다. 즉, DOI를 가리키는 링크, 예를 들어 트위터 등이다. 이 서비스는 어느 순간 신뢰할 수 없게 변해 가방이 보관되었다.

  • seaaroundus: Seaaroundus 어업과 어업 관련 데이터를 유지한다.나는 API의 R 패키지를 유지하는 것을 돕고 있지만, 이것은 유지하기 어려운 패키지이며, 대부분의 사용자들이 전자 우편으로 데이터를 저장해 달라고 요청하기 때문에 이 패키지는 압축되어 있다.

  • rdpla: Digital Public Library of America는 매우 멋진 조직으로 어느 정도에 크로스워드와 유사하다. 왜냐하면 그들은'사물'에 관한 메타데이터를 집중했기 때문이다.DPLA 박물관 소장품 메타데이터와 Crossref 학술 작품 메타데이터.많은 연구자들이 쉽게 DPLA에서 메타데이터를 얻어 박물관 소장품에 사용할 수 있는 연구를 좋아할 것 같다.결국 이 패키지를 사용하는 사람은 별로 없었다.

  • rjsonapi: JSON:API는 아주 멋진 생각이다. JSON으로 API를 구축하는 규범이다.REST API는 변화무쌍하다. 이를 표준화하기 위한 시도이다.나는 JSON: API가 광범위하게 사용될 수 있고 R 클라이언트가 JSON: API 서비스를 사용할 때 매우 유용할 것이라고 생각한다. 그러나 나는 API가 JSON: API를 사용하는 경우가 매우 적다는 것만 보았다.
  • 다음 네 개의 소프트웨어 패키지는 모두 정부에서 데이터 원본을 개방한 R 클라이언트 - 정부 데이터에 관한 R 패키지입니다. 조직rOpenGov을 참조하십시오.

  • vvdat: 두 개의 패키지(rsunlightrtimes로 나뉘었고 govdat 저장

  • rsunlight: 이 조직의 많은 API 고객Sunlight Labs이다. 이 패키지를 압축하는 일부 원인은 햇빛 실험실의 해체이다. 그래서 이전에 많은 API를 R 패키지로 구성하는 것이 현명하지 못했다.그 밖에 정부 데이터는 우리가 로펜시에서 일하는 범위를 넘어섰다고 여겨진다.

  • rtimes: NYT의 여러 정부 데이터 API 고객입니다.이 패키지를 포기한 이유 중 하나는 뉴욕타임스가 API에 대한 질문/피드백에 거의 답장을 하지 않았기 때문이다.또 다른 이유는 로펜시의 이 같은 관심 때문이다.

  • enigma: Enigma API(저는 이 회사가 최초로 개방된 정부 데이터를 더욱 쉽게 접근할 수 있도록 노력했다고 생각합니다)와 회사 데이터의 고객입니다.비록 나는 이 소프트웨어 패키지를 실제로 사용하지 않았고, 게다가 이 소프트웨어 패키지의 사용률도 높지 않기 때문에 나는 그것을 보관했다.
  • 이러한 목록의 요약으로 각 패키지 아카이빙의 주요 원인 목록은 다음과 같습니다.
  • 미사용
  • rjsonapi
  • rdpla
  • etseed
  • 수수께끼
  • rgauges
  • rtimes
  • 불량/퇴역 서비스
  • rtimes
  • 바다의 고리
  • crevents
  • alm
  • 개명
  • ropensnp
  • Spocutils
  • 새로운 포장의 변천
  • 듀오
  • govdat
  • 반복 작업
  • nneo
  • 범위 초과
  • rsunlight
  • 좋은 웹페이지 즐겨찾기