Lua 4.0 문자열 관련
TString 데이터 구 조 는 다음 과 같 습 니 다. TString 은 문자열 만 처리 하 는 것 이 아니 라 사용자 정의 데 이 터 를 처리 하 는 데 도 사용 할 수 있 습 니 다.
/*
** String headers for string table
*/
/*
** most `malloc' libraries allocate memory in blocks of 8 bytes. TSPACK
** tries to make sizeof(TString) a multiple of this granularity, to reduce
** waste of space.
*/
#define TSPACK((int)sizeof(int))
typedef struct TString {
union {
struct { /* for strings */
unsigned long hash;
int constindex; /* hint to reuse constants */
} s;
struct { /* for userdata */
int tag;
void *value;
} d;
} u;
size_t len;
struct TString *nexthash; /* chain for hash table */
int marked;
char str[TSPACK]; /* variable length string!! must be the last field! */
} TString;
TSPACK 주석 에 메모리 정렬 을 위 한 설명 이 있 습 니 다.
TString 은 문자열 과 사용자 정의 데 이 터 를 나타 내 는 두 개의 결합 체 가 있 습 니 다.
len 문자열 의 길이 입 니 다.
nexthash 문자열 표 에서 다음 TString 을 표시 합 니 다.
marked 쓰레기 회수 라벨.
str 는 데 이 터 를 저장 하 는 데 쓰 인 다.
TString 이 사용 하 는 이러한 데이터 구 조 는 유연성 배열 이 라 고 합 니 다. 즉, 데이터 구조 뒤의 공간 은 지침 을 통 해 참조 할 수 있 습 니 다.
여기 서 는 실제 수요 에 따라 str 배열 에 충분 한 메모리 공간 을 할당 하여 사용 할 수 있 습 니 다.
str 배열 이 동적 으로 할당 할 수 있 는 크기 처럼 보 입 니 다.
문자열 과 연 결 된 파일 은 lstring. h, lstring. c 입 니 다.
#define sizestring(l) ((long)sizeof(TString) + ((long)(l+1)-TSPACK)*(long)sizeof(char))
sizestring 매크로 는 문자열 의 길이 에 따라 필요 한 TString 데이터 구조의 메모리 크기 를 얻 습 니 다.
구체 적 인 코드 를 살 펴 보 겠 습 니 다.
/*
** type equivalent to TString, but with maximum alignment requirements
*/
union L_UTString {
TString ts;
union L_Umaxalign dummy; /* ensures maximum alignment for `local' udata */
};
메모리 정렬 을 보증 합 니 다.
초기 화 와 청 소 를 보십시오.
void luaS_init (lua_State *L) {
L->strt.hash = luaM_newvector(L, 1, TString *);
L->udt.hash = luaM_newvector(L, 1, TString *);
L->nblocks += 2*sizeof(TString *);
L->strt.size = L->udt.size = 1;
L->strt.nuse = L->udt.nuse = 0;
L->strt.hash[0] = L->udt.hash[0] = NULL;
}
상태 기 L 의 stringtable 문자열 표 strt 와 사용자 정의 데이터 시트 udt 를 초기 화 합 니 다.
현재 L 의 메모리 사용 공간 을 늘 립 니 다.
초기 크기 size 를 1 로 설정 하고 사용 한 공간 은 0 입 니 다.
hash 포인 터 를 NULL 로 설정 합 니 다.
void luaS_freeall (lua_State *L) {
LUA_ASSERT(L->strt.nuse==0, "non-empty string table");
L->nblocks -= (L->strt.size + L->udt.size)*sizeof(TString *);
luaM_free(L, L->strt.hash);
LUA_ASSERT(L->udt.nuse==0, "non-empty udata table");
luaM_free(L, L->udt.hash);
}
공간 을 방출 합 니 다. init 와 반대 되 는 동작 입 니 다. 방출 시 표 는 비어 있어 야 합 니 다.
TString 의 배분
TString *luaS_new (lua_State *L, const char *str) {
return luaS_newlstr(L, str, strlen(str));
}
char * 형 문자열 을 입력 하고 해당 하 는 TString 형 데이터 구 조 를 되 돌려 줍 니 다.
세 번 째 매개 변 수 는 문자열 str 의 길이 입 니 다.
TString *luaS_newfixed (lua_State *L, const char *str) {
TString *ts = luaS_new(L, str);
if (ts->marked == 0) ts->marked = FIXMARK; /* avoid GC */
return ts;
}
luaS 호출new, 쓰레기 수 거 를 피하 기 위해 되 돌아 오 는 TString marked 를 FIXMARK 로 설정 합 니 다.
FIXMARK 와 대응 하 는 또 다른 매크로 는 RESERVEDMARK 로 글 자 를 보존 하 는 데 사용 된다.
/*
** any TString with mark>=FIXMARK is never collected.
** Marks>=RESERVEDMARK are used to identify reserved words.
*/
#define FIXMARK 2
#define RESERVEDMARK3
우 리 는 어법 에서 luaX 를 분석 하 는 것 을 볼 수 있다.int 중,
void luaX_init (lua_State *L) {
int i;
for (i=0; i<NUM_RESERVED; i++) {
TString *ts = luaS_new(L, token2string[i]);
ts->marked = (unsigned char)(RESERVEDMARK+i); /* reserved word */
}
}
프로그램 호출 luaSnew, 되 돌아 오 는 TString marked 를 RESERVEDMARK 에 보존 문자 번 호 를 추가 합 니 다.
사용 할 때 이 marked 에 따라 해당 하 는 보존 자 를 얻 을 수 있 습 니 다.
luaS_new 는 luaS 호출 을 통 해newlstr 는 구체 적 인 일 을 합 니 다:
TString *luaS_newlstr (lua_State *L, const char *str, size_t l) {
unsigned long h = hash_s(str, l);
int h1 = h & (L->strt.size-1);
TString *ts;
for (ts = L->strt.hash[h1]; ts; ts = ts->nexthash) {
if (ts->len == l && (memcmp(str, ts->str, l) == 0))
return ts;
}
/* not found */
ts = (TString *)luaM_malloc(L, sizestring(l));
ts->marked = 0;
ts->nexthash = NULL;
ts->len = l;
ts->u.s.hash = h;
ts->u.s.constindex = 0;
memcpy(ts->str, str, l);
ts->str[l] = 0; /* ending 0 */
L->nblocks += sizestring(l);
newentry(L, &L->strt, ts, h1); /* insert it on table */
return ts;
}
프로그램 이 올 라 오 자마자 str 의 해시 값 을 먼저 계산한다.해시 값 을 계산 하 는 알고리즘 은?
static unsigned long hash_s (const char *s, size_t l) {
unsigned long h = l; /* seed */
size_t step = (l>>5)|1; /* if string is too long, don't hash all its chars */
for (; l>=step; l-=step)
h = h ^ ((h<<5)+(h>>2)+(unsigned char)*(s++));
return h;
}
계 산 된 해시 에 따 르 면 문자열 해시 표 의 위 치 를 찾 을 수 있 습 니 다.L - > strt. size 는 줄곧 2 의 정수 차 멱 이다.
int h1 = h & (L->strt.size-1); 이 문장 은 해시 값 을 정확 한 아래 표 에 비 추 었 다.
for 순환 은 해시 표 에서 지정 한 문자열 을 찾 습 니 다. 찾 으 면 되 돌려 줍 니 다.
그렇지 않 으 면 추가 합 니 다.
TString 의 인 자 를 설정 하고 newentry 를 통 해 해시 표 에 추가 합 니 다.
static void newentry (lua_State *L, stringtable *tb, TString *ts, int h) {
ts->nexthash = tb->hash[h]; /* chain new entry */
tb->hash[h] = ts;
tb->nuse++;
if (tb->nuse > (lint32)tb->size && tb->size < MAX_INT/2) /* too crowded? */
luaS_resize(L, tb, tb->size*2);
}
해시 표를 추가 한 후 해시 표 가 절반 이상 사용 되 었 는 지 확인 하 세 요.만약 절반 을 사용한다 면, 용량 을 늘 려 야 한다.
용량 을 늘 려 현재 의 size 를 배로 늘리다.이것 은 해시 표 의 사이즈 가 줄곧 2 의 정수 차 멱 임 을 보증 했다.
void luaS_resize (lua_State *L, stringtable *tb, int newsize) {
TString **newhash = luaM_newvector(L, newsize, TString *);
int i;
for (i=0; i<newsize; i++) newhash[i] = NULL;
/* rehash */
for (i=0; i<tb->size; i++) {
TString *p = tb->hash[i];
while (p) { /* for each node in the list */
TString *next = p->nexthash; /* save next */
unsigned long h = (tb == &L->strt) ? p->u.s.hash : IntPoint(p->u.d.value);
int h1 = h&(newsize-1); /* new position */
LUA_ASSERT(h%newsize == (h&(newsize-1)),
"a&(x-1) == a%x, for x power of 2");
p->nexthash = newhash[h1]; /* chain it in new position */
newhash[h1] = p;
p = next;
}
}
luaM_free(L, tb->hash);
L->nblocks += (newsize - tb->size)*sizeof(TString *);
tb->size = newsize;
tb->hash = newhash;
}
새 해시 표 에 공간 을 할당 하고 초기 포인 터 를 NULL 로 설정 합 니 다.
오래된 해시 표 의 값 을 새 해시 표 에 설정 합 니 다.
이 한 마디 조심 하 세 요.
unsigned long h = (tb == &L->strt) ? p->u.s.hash : IntPoint(p->u.d.value);
UserData 도 luaS 를 사용 해 야 하기 때 문 입 니 다.resize 라 는 함수 때문에 들 어 오 는 것 이 어떤 해시 표 인지 판단 하기 위해 서 입 니 다.
udata 관련 luaScreateudata 와 luaSnewudata 는 문자열 과 유사 하여 더 이상 설명 하지 않 습 니 다.
문자열 에 대한 분석 은 여기 서 끝 납 니 다.
----------------------------------------
지금까지 의 문제:
> 함수 원형 최적화 luaUoptchunk
> 인쇄 함수 원형 luaUprintchunk
> dump 함수 원형 luaUdumpchunk
----------------------------------------
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Neovim을 위한 자동 완성NeoVim으로 생산성을 높일 수 있는 가장 멋진 기능 중 하나는 자동 완성이므로 성능에 따라 플러그인을 선택할 수 있습니다. YouCompleteMe Coc.nvim 이 플러그인은 사용하기 좋지만 Javascrip...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.