Lua 4.0 문자열 관련

7426 단어 luaLua4.0
이 절 은 문자열 과 관련 된 것 을 보 세 요:
TString 데이터 구 조 는 다음 과 같 습 니 다. TString 은 문자열 만 처리 하 는 것 이 아니 라 사용자 정의 데 이 터 를 처리 하 는 데 도 사용 할 수 있 습 니 다.
/*
** String headers for string table
*/
/*
** most `malloc' libraries allocate memory in blocks of 8 bytes. TSPACK
** tries to make sizeof(TString) a multiple of this granularity, to reduce
** waste of space.
*/
#define TSPACK((int)sizeof(int))
typedef struct TString {
  union {
    struct {  /* for strings */
      unsigned long hash;
      int constindex;  /* hint to reuse constants */
    } s;
    struct {  /* for userdata */
      int tag;
      void *value;
    } d;
  } u;
  size_t len;
  struct TString *nexthash;  /* chain for hash table */
  int marked;
  char str[TSPACK];   /* variable length string!! must be the last field! */
} TString;

TSPACK 주석 에 메모리 정렬 을 위 한 설명 이 있 습 니 다.
TString 은 문자열 과 사용자 정의 데 이 터 를 나타 내 는 두 개의 결합 체 가 있 습 니 다.
len 문자열 의 길이 입 니 다.
nexthash 문자열 표 에서 다음 TString 을 표시 합 니 다.
marked 쓰레기 회수 라벨.
str 는 데 이 터 를 저장 하 는 데 쓰 인 다.
TString 이 사용 하 는 이러한 데이터 구 조 는 유연성 배열 이 라 고 합 니 다. 즉, 데이터 구조 뒤의 공간 은 지침 을 통 해 참조 할 수 있 습 니 다.
여기 서 는 실제 수요 에 따라 str 배열 에 충분 한 메모리 공간 을 할당 하여 사용 할 수 있 습 니 다.
str 배열 이 동적 으로 할당 할 수 있 는 크기 처럼 보 입 니 다.
문자열 과 연 결 된 파일 은 lstring. h, lstring. c 입 니 다.
#define sizestring(l)   ((long)sizeof(TString) + ((long)(l+1)-TSPACK)*(long)sizeof(char))

sizestring 매크로 는 문자열 의 길이 에 따라 필요 한 TString 데이터 구조의 메모리 크기 를 얻 습 니 다.
구체 적 인 코드 를 살 펴 보 겠 습 니 다.
/*
** type equivalent to TString, but with maximum alignment requirements
*/
union L_UTString {
  TString ts;
  union L_Umaxalign dummy;  /* ensures maximum alignment for `local' udata */
};

메모리 정렬 을 보증 합 니 다.
초기 화 와 청 소 를 보십시오.
void luaS_init (lua_State *L) {
  L->strt.hash = luaM_newvector(L, 1, TString *);
  L->udt.hash = luaM_newvector(L, 1, TString *);
  L->nblocks += 2*sizeof(TString *);
  L->strt.size = L->udt.size = 1;
  L->strt.nuse = L->udt.nuse = 0;
  L->strt.hash[0] = L->udt.hash[0] = NULL;
}

상태 기 L 의 stringtable 문자열 표 strt 와 사용자 정의 데이터 시트 udt 를 초기 화 합 니 다.
현재 L 의 메모리 사용 공간 을 늘 립 니 다.
초기 크기 size 를 1 로 설정 하고 사용 한 공간 은 0 입 니 다.
hash 포인 터 를 NULL 로 설정 합 니 다.
void luaS_freeall (lua_State *L) {
  LUA_ASSERT(L->strt.nuse==0, "non-empty string table");
  L->nblocks -= (L->strt.size + L->udt.size)*sizeof(TString *);
  luaM_free(L, L->strt.hash);
  LUA_ASSERT(L->udt.nuse==0, "non-empty udata table");
  luaM_free(L, L->udt.hash);
}

공간 을 방출 합 니 다. init 와 반대 되 는 동작 입 니 다. 방출 시 표 는 비어 있어 야 합 니 다.
TString 의 배분
TString *luaS_new (lua_State *L, const char *str) {
  return luaS_newlstr(L, str, strlen(str));
}

char * 형 문자열 을 입력 하고 해당 하 는 TString 형 데이터 구 조 를 되 돌려 줍 니 다.
세 번 째 매개 변 수 는 문자열 str 의 길이 입 니 다.
TString *luaS_newfixed (lua_State *L, const char *str) {
  TString *ts = luaS_new(L, str);
  if (ts->marked == 0) ts->marked = FIXMARK;  /* avoid GC */
  return ts;
}

luaS 호출new, 쓰레기 수 거 를 피하 기 위해 되 돌아 오 는 TString marked 를 FIXMARK 로 설정 합 니 다.
FIXMARK 와 대응 하 는 또 다른 매크로 는 RESERVEDMARK 로 글 자 를 보존 하 는 데 사용 된다.
/*
** any TString with mark>=FIXMARK is never collected.
** Marks>=RESERVEDMARK are used to identify reserved words.
*/
#define FIXMARK 2
#define RESERVEDMARK3

우 리 는 어법 에서 luaX 를 분석 하 는 것 을 볼 수 있다.int 중,
void luaX_init (lua_State *L) {
  int i;
  for (i=0; i<NUM_RESERVED; i++) {
    TString *ts = luaS_new(L, token2string[i]);
    ts->marked = (unsigned char)(RESERVEDMARK+i);  /* reserved word */
  }
}

프로그램 호출 luaSnew, 되 돌아 오 는 TString marked 를 RESERVEDMARK 에 보존 문자 번 호 를 추가 합 니 다.
사용 할 때 이 marked 에 따라 해당 하 는 보존 자 를 얻 을 수 있 습 니 다.
luaS_new 는 luaS 호출 을 통 해newlstr 는 구체 적 인 일 을 합 니 다:
TString *luaS_newlstr (lua_State *L, const char *str, size_t l) {
  unsigned long h = hash_s(str, l);
  int h1 = h & (L->strt.size-1);
  TString *ts;
  for (ts = L->strt.hash[h1]; ts; ts = ts->nexthash) {
    if (ts->len == l && (memcmp(str, ts->str, l) == 0))
      return ts;
  }
  /* not found */
  ts = (TString *)luaM_malloc(L, sizestring(l));
  ts->marked = 0;
  ts->nexthash = NULL;
  ts->len = l;
  ts->u.s.hash = h;
  ts->u.s.constindex = 0;
  memcpy(ts->str, str, l);
  ts->str[l] = 0;  /* ending 0 */
  L->nblocks += sizestring(l);
  newentry(L, &L->strt, ts, h1);  /* insert it on table */
  return ts;
}

프로그램 이 올 라 오 자마자 str 의 해시 값 을 먼저 계산한다.해시 값 을 계산 하 는 알고리즘 은?
static unsigned long hash_s (const char *s, size_t l) {
  unsigned long h = l;  /* seed */
  size_t step = (l>>5)|1;  /* if string is too long, don't hash all its chars */
  for (; l>=step; l-=step)
    h = h ^ ((h<<5)+(h>>2)+(unsigned char)*(s++));
  return h;
}

계 산 된 해시 에 따 르 면 문자열 해시 표 의 위 치 를 찾 을 수 있 습 니 다.L - > strt. size 는 줄곧 2 의 정수 차 멱 이다.
  int h1 = h & (L->strt.size-1); 이 문장 은 해시 값 을 정확 한 아래 표 에 비 추 었 다.
for 순환 은 해시 표 에서 지정 한 문자열 을 찾 습 니 다. 찾 으 면 되 돌려 줍 니 다.
그렇지 않 으 면 추가 합 니 다.
TString 의 인 자 를 설정 하고 newentry 를 통 해 해시 표 에 추가 합 니 다.
static void newentry (lua_State *L, stringtable *tb, TString *ts, int h) {
  ts->nexthash = tb->hash[h];  /* chain new entry */
  tb->hash[h] = ts;
  tb->nuse++;
  if (tb->nuse > (lint32)tb->size && tb->size < MAX_INT/2)  /* too crowded? */
    luaS_resize(L, tb, tb->size*2);
}

해시 표를 추가 한 후 해시 표 가 절반 이상 사용 되 었 는 지 확인 하 세 요.만약 절반 을 사용한다 면, 용량 을 늘 려 야 한다.
용량 을 늘 려 현재 의 size 를 배로 늘리다.이것 은 해시 표 의 사이즈 가 줄곧 2 의 정수 차 멱 임 을 보증 했다.
void luaS_resize (lua_State *L, stringtable *tb, int newsize) {
  TString **newhash = luaM_newvector(L, newsize, TString *);
  int i;
  for (i=0; i<newsize; i++) newhash[i] = NULL;
  /* rehash */
  for (i=0; i<tb->size; i++) {
    TString *p = tb->hash[i];
    while (p) {  /* for each node in the list */
      TString *next = p->nexthash;  /* save next */
      unsigned long h = (tb == &L->strt) ? p->u.s.hash : IntPoint(p->u.d.value);
      int h1 = h&(newsize-1);  /* new position */
      LUA_ASSERT(h%newsize == (h&(newsize-1)),
                    "a&(x-1) == a%x, for x power of 2");
      p->nexthash = newhash[h1];  /* chain it in new position */
      newhash[h1] = p;
      p = next;
    }
  }
  luaM_free(L, tb->hash);
  L->nblocks += (newsize - tb->size)*sizeof(TString *);
  tb->size = newsize;
  tb->hash = newhash;
}

새 해시 표 에 공간 을 할당 하고 초기 포인 터 를 NULL 로 설정 합 니 다.
오래된 해시 표 의 값 을 새 해시 표 에 설정 합 니 다.
이 한 마디 조심 하 세 요.
unsigned long h = (tb == &L->strt) ? p->u.s.hash : IntPoint(p->u.d.value);

UserData 도 luaS 를 사용 해 야 하기 때 문 입 니 다.resize 라 는 함수 때문에 들 어 오 는 것 이 어떤 해시 표 인지 판단 하기 위해 서 입 니 다.
udata 관련 luaScreateudata 와 luaSnewudata 는 문자열 과 유사 하여 더 이상 설명 하지 않 습 니 다.
문자열 에 대한 분석 은 여기 서 끝 납 니 다.
----------------------------------------
지금까지 의 문제:
> 함수 원형 최적화 luaUoptchunk
> 인쇄 함수 원형 luaUprintchunk
> dump 함수 원형 luaUdumpchunk
----------------------------------------

좋은 웹페이지 즐겨찾기