dreamxyp 发表于 2013-10-21 19:17:56

erlang NIF部分接口实现(三)持久资源

持久资源是NIF中一类非常有用接口,可以把资源看成各种数据结构描述符,然后在各个模块间传递数据结构,从而使得写erlang程序像写c程序一样,弥补一些erlang程序在性能上的不足。使用持久资源,需要首先创建持久资源类,这些工作可以在NIF被load时进行。
ErlNifResourceType*
enif_open_resource_type(ErlNifEnv* env,
                        const char* module_str,
                        const char* name_str,
                        ErlNifResourceDtor* dtor,
                        ErlNifResourceFlags flags,
                        ErlNifResourceFlags* tried)
{
    ErlNifResourceType* type = NULL;
    ErlNifResourceFlags op = flags;
    Eterm module_am, name_am;

    ASSERT(erts_smp_thr_progress_is_blocking());
    ASSERT(module_str == NULL); /* for now... */
    module_am = make_atom(env->mod_nif->mod->module);
    name_am = enif_make_atom(env, name_str);

    type = find_resource_type(module_am, name_am);
    if (type == NULL) {
        if (flags & ERL_NIF_RT_CREATE) {
          type = erts_alloc(ERTS_ALC_T_NIF, sizeof(struct enif_resource_type_t));
          type->dtor = dtor;
          type->module = module_am;
          type->name = name_am;
          erts_refc_init(&type->refc, 1);
          type->owner = env->mod_nif;
          type->prev = &resource_type_list;
          type->next = resource_type_list.next;
          type->next->prev = type;
          type->prev->next = type;
          op = ERL_NIF_RT_CREATE;
        }
    }
    else {
        if (flags & ERL_NIF_RT_TAKEOVER) {       
          steal_resource_type(type);
          op = ERL_NIF_RT_TAKEOVER;
        }
        else {
          type = NULL;
        }
    }
    if (type != NULL) {
        type->owner = env->mod_nif;
        type->dtor = dtor;
        if (type->dtor != NULL) {
          erts_refc_inc(&type->owner->rt_dtor_cnt, 1);
        }
        erts_refc_inc(&type->owner->rt_cnt, 1);   
    }
    if (tried != NULL) {
        *tried = op;
    }
    return type;
}

该接口用于创建一类持久资源,资源名为参数name_str,为资源分配资源描述符ErlNifResourceType,并为其记录资源析构器dtor,为了能使得持久资源也使用erlang的gc机制,需要为资源提供一个析构器回调,使得在资源没有被使用时,由gc正确释放。持久资源的析构器需要用户自行实现。
void* enif_alloc_resource(ErlNifResourceType* type, size_t size)
{
    Binary* bin = erts_create_magic_binary(SIZEOF_ErlNifResource(size), &nif_resource_dtor);
    ErlNifResource* resource = ERTS_MAGIC_BIN_DATA(bin);
    resource->type = type;
    erts_refc_inc(&bin->refc, 1);
#ifdef DEBUG
    erts_refc_init(&resource->nif_refc, 1);
#endif
    erts_refc_inc(&resource->type->refc, 2);
    return resource->data;
}
#define SIZEOF_ErlNifResource(SIZE) (offsetof(ErlNifResource,data) + (SIZE))


由于持久资源相当于一段内存,因此其最重要的功能即为内存分配,enif_alloc_resource用于分配资源所占的内存。
ERTS_GLB_INLINE Binary *erts_create_magic_binary(Uint size, void (*destructor)(Binary *))
{
    Uint bsize = ERTS_MAGIC_BIN_SIZE(size);
    Binary* bptr = erts_alloc_fnf(ERTS_ALC_T_BINARY, bsize);
    if (!bptr)
        erts_alloc_n_enomem(ERTS_ALC_T2N(ERTS_ALC_T_BINARY), bsize);
    ERTS_CHK_BIN_ALIGNMENT(bptr);
    bptr->flags = BIN_FLAG_MAGIC;
    bptr->orig_size = ERTS_MAGIC_BIN_ORIG_SIZE(size);
    erts_refc_init(&bptr->refc, 0);
    ERTS_MAGIC_BIN_DESTRUCTOR(bptr) = destructor;
    return bptr;
}
#define ERTS_MAGIC_BIN_SIZE(Sz) (offsetof(ErtsMagicBinary,magic_bin_data) + (Sz))


可以看到持久资源的内存分配器,也是ERTS_ALC_A_BINARY,但是其分配的内存包括三个部分:
1.ErtsMagicBinary:用于将资源融入ERTS_ALC_A_BINARY分配器;
2.ErlNifResource:用于将建立持久资源的抽象层;
3.持久资源本身:持久资源所占内存部分。
这里有个值得注意的地方,在erts_create_magic_binary调用erts_alloc_fnf时,返回的不是一个ErtsMagicBinary结构,而是一个Binary结构。
typedef struct binary {
    ERTS_INTERNAL_BINARY_FIELDS
    SWord orig_size;
    char orig_bytes; /* to be continued */
} Binary;
typedef struct {
    ERTS_INTERNAL_BINARY_FIELDS
    SWord orig_size;
    void (*destructor)(Binary *);
    char magic_bin_data;
} ErtsMagicBinary;
#define ERTS_INTERNAL_BINARY_FIELDS                                \
    UWord flags;                                                        \
    erts_refc_t refc;                                                \
    ERTS_BINARY_STRUCT_ALIGNMENT


ErtsMagicBinary与Binary在拥有公共的成员,包括flags,refc等,而flags中记录了数据结构的真正类型,erts_create_magic_binary将此处分配的Binary初始化为BIN_FLAG_MAGIC类型,这是一种多态的手法。
除了分配内存,enif_alloc_resource还将资源的析构器设置为nif_resource_dtor:
static void nif_resource_dtor(Binary* bin)
{
    ErlNifResource* resource = (ErlNifResource*) ERTS_MAGIC_BIN_DATA(bin);
    ErlNifResourceType* type = resource->type;
    ASSERT(ERTS_MAGIC_BIN_DESTRUCTOR(bin) == &nif_resource_dtor);

    if (type->dtor != NULL) {
        ErlNifEnv env;
        pre_nif_noproc(&env, type->owner);
        type->dtor(&env,resource->data);
        post_nif_noproc(&env);
    }
    if (erts_refc_dectest(&type->refc, 0) == 0) {
        ASSERT(type->next == NULL);
        ASSERT(type->owner != NULL);
        ASSERT(type->owner->mod == NULL);
        steal_resource_type(type);
        erts_free(ERTS_ALC_T_NIF, type);
    }
}







可以看到,这个析构器是真正的外层融入gc的析构器,它从资源的 ErtsMagicBinary结构中取得ErlNifResource结构,利用这个结构内记录的资源真正的析构器释放资源。
enif_alloc_resource在为资源分配内存时,还需要为资源设置正确的类型,类型即为该函数的第一个参数。
资源可以通过make接口传递到erlang模块中:
ERL_NIF_TERM enif_make_resource(ErlNifEnv* env, void* obj)
{
    ErlNifResource* resource = DATA_TO_RESOURCE(obj);
    ErtsBinary* bin = ERTS_MAGIC_BIN_FROM_DATA(resource);
    Eterm* hp = alloc_heap(env,PROC_BIN_SIZE);
    return erts_mk_magic_binary_term(&hp, &MSO(env->proc), &bin->binary);
}
ERTS_GLB_INLINE Eterm
erts_mk_magic_binary_term(Eterm **hpp, ErlOffHeap *ohp, Binary *mbp)
{
    ProcBin *pb = (ProcBin *) *hpp;
    *hpp += PROC_BIN_SIZE;

    ASSERT(mbp->flags & BIN_FLAG_MAGIC);

    pb->thing_word = HEADER_PROC_BIN;
    pb->size = 0;
    pb->next = ohp->first;
    ohp->first = (struct erl_off_heap_header*) pb;
    pb->val = mbp;
    pb->bytes = (byte *) mbp->orig_bytes;
    pb->flags = 0;

    erts_refc_inc(&mbp->refc, 1);

    return make_binary(pb);   
}


首先需要在进程堆上分配一个ProcBin结构,使得包裹资源的Binary能够传递到进程执行流中去,注意,通常binary在小于64字节时,可以直接分配到进程堆上,但是由于资源并不是特定于进程的,所以应该由ERTS_ALC_A_BINARY分配器分配,而不是由ERTS_ALC_A_EHEAP分配器分配,其生命周期也与进程无关。另外需要注意的是,持久资源对应的ProcBin结构,其数据长度为0,用户在调用资源创建接口建立的资源,在控制台上的输出也是<<>>。


如果将来需要在某个时机取得资源,可以调用如下接口:
int enif_get_resource(ErlNifEnv* env, ERL_NIF_TERM term, ErlNifResourceType* type,
                      void** objp)
{
    ProcBin* pb;
    Binary* mbin;
    ErlNifResource* resource;
    if (!ERTS_TERM_IS_MAGIC_BINARY(term)) {
        return 0;
    }
    pb = (ProcBin*) binary_val(term);
    /*if (pb->size != 0) {       
        return 0; / * Or should we allow "resource binaries" as handles? * /
    }*/
    mbin = pb->val;
    resource = (ErlNifResource*) ERTS_MAGIC_BIN_DATA(mbin);
    if (ERTS_MAGIC_BIN_DESTRUCTOR(mbin) != &nif_resource_dtor
        || resource->type != type) {       
        return 0;
    }
    *objp = resource->data;
    return 1;
}
#define ERTS_MAGIC_BIN_DATA(BP) \
((void *) ((ErtsBinary *) (BP))->magic_binary.magic_bin_data)


binary本身是有多态机制的,在从binary中提取资源描述符时,也需要判断binary是否ErtsMagicBinary,可以通过
ERTS_TERM_IS_MAGIC_BINARY宏进行判断,资源描述符ErlNifResource是包裹在ErtsMagicBinary结构中的,而真正的资源数据结构又是包裹在ErlNifResource结构中的,就像剥洋葱,一层一层的剥去外层数据结构,最终到的持久资源本身的数据结构。
gc可以在正确的时机释放持久资源所占的内存了,如果用户需要主动释放内存,可以调用:
void enif_release_resource(void* obj)
{
    ErlNifResource* resource = DATA_TO_RESOURCE(obj);
    ErtsBinary* bin = ERTS_MAGIC_BIN_FROM_DATA(resource);

    ASSERT(ERTS_MAGIC_BIN_DESTRUCTOR(bin) == &nif_resource_dtor);
#ifdef DEBUG
    erts_refc_dec(&resource->nif_refc, 0);
#endif
    if (erts_refc_dectest(&bin->binary.refc, 0) == 0) {
        erts_bin_free(&bin->binary);
    }
}


由于资源可以被共享,因此资源本身是有引用计数的,当引用计数减为0,资源就可以被真正释放了。
增加资源的引用计数可以通过如下接口:
void enif_keep_resource(void* obj)
{
    ErlNifResource* resource = DATA_TO_RESOURCE(obj);
    ErtsBinary* bin = ERTS_MAGIC_BIN_FROM_DATA(resource);

    ASSERT(ERTS_MAGIC_BIN_DESTRUCTOR(bin) == &nif_resource_dtor);
#ifdef DEBUG
    erts_refc_inc(&resource->nif_refc, 1);
#endif
    erts_refc_inc(&bin->binary.refc, 2);
}



增加和减少资源的引用计数的次数必须匹配,否则可能引发问题。
至此,持久资源的主要接口的实现就介绍完了,用户使用时,可以先通过enif_open_resource_type建立资源类型的描述符,然后利用此描述符,使用enif_alloc_resource分配资源所占用的内存空间,使用enif_make_resource将资源导出到erlang模块层,在进程间传递资源描述符,资源再传回NIF时,可以通过enif_get_resource取回资源描述符中的资源数据结构,同时可以通过enif_keep_resource来共享资源,通过enif_release_resource来放弃使用资源,gc系统也会正确回收引用计数为0的资源,开发者再也不用担心内存没有被正确释放了。
持久资源为NIF的开发带来了极大的便利,用户可以将一些大规模的数据结构一次传入内存,生成一个资源描述符,然后在进程间传递资源描述符而不是资源数据本身,减轻每次资源数据拷贝的开销,同时持久资源也是线程安全的,写erlang程序也可以像写c程序一样高效了。

页: [1]
查看完整版本: erlang NIF部分接口实现(三)持久资源