哲思官方群认证群组  - 讨论区

标题:[zeuux-universe] [SA]Ganglia 和 Nagios 实战咨询

2009年12月06日 星期日 15:18

Zoom.Quiet zoom.quiet在gmail.com
星期日 十二月 6 15:18:28 CST 2009

我的动态
http://www.zeuux.com/friend/user/zoomquiet/mood/content/1896/
@chifeng 招唤有体验的SA 哪!
Ganglia实时监察云台 [FreeBSDChina Wiki]
http://wiki.freebsdchina.org/howto/g/gangliainit

根据理解部署好集群,但是没有按照设想来进行统计...

核心问题是 在 Ganglia 中:
- Grid
- data_source
- gmond

以上三者的关系?

在俺来看:
- gmond 是监察客户端,代表一个主机
- data_source 就是集群声明,使用同一 data_source 名称的所有 gmond 就聚合成一个集群
- Grid 是更加高层的虚拟集群,代表一个 gmetad 监控主节点,以便日后通过主节点进行分布式监察部署



2009/11/26 chifeng <chifeng在gmail.com>:
> 呵呵,不是不想send-pr,主要是这个ports里有MAINTAINER打的patch,惭愧,俺没花时间看这patch是啥意思,所以没能力send-pr.....:$
>
>
> 2009/11/26 Zhou Sutra <zhoushuqun在gmail.com>
>>
>> On 2009-11-26, at 下午12:07, chifeng wrote:
>>
>> FreeBSD的话,更简单,直接通过ports就搞定了。make package然后发布即可。不过目前ports里还是3.1.1版本,这点比较郁闷
>>
>> 有兴趣参与upgrade一下ports呗,我一般发现需要用的东西版本有点低我就send pr。
>>
>> nagios的配置略显麻烦一点,不过还是可以接受的,建议别用其agent,只做服务器死活、服务死活报警。
>>
>> Ganglia默认有cpu,内存,硬盘,网络,进程数监控。但是很容通过python来扩展,可以用Ganglia来得到这些具体数据,文字的画图的均可哦。当然不会写python的同学,也可以直接写script来扩展
>> :D
>> 监控这事其实也是根据个人口味,我觉得这两个配合使用,基本上是无敌了。
>> 云监控!!!
>>
>> 贴一些Ganglia的文档:
>> http://ganglia.info/
>> http://www.ibm.com/developerworks/wikis/display/WikiPtype/ganglia
>> http://tapir.sajinet.com.pe/ganglia/
>> http://sourceforge.net/apps/trac/ganglia/wiki
>> http://wiki.freaks-unidos.net/ganglia-quickstart
>>
>> 另外,大妈,我这儿有个自己做的slides,msn我一下给你参考参考。
>>
>> Chifeng
>>
>>
>> 2009/11/26 Bill Xu <bill在zeuux.org>
>>>
>>>
>>> Zoom.Quiet 写道:
>>>>
>>>> 通过 zeuux.com 俺状态的讨论,才知道池峰是和俺同样的在关注靠谱的系统监控平台;
>>>> 找到相关文章:Ganglia 和 Nagios,第 2 部分: 使用 Nagios 监视企业集群
>>>>    http://www.ibm.com/developerworks/cn/linux/l-ganglia-nagios-2/
>>>> 这就非常吻合俺的设想:
>>>> - 一个专业的轻便的实时监察系统来积累长期的系统运营趋势来预测问题
>>>> - 一个专业的主机/服务状态报警平台来及时响应问题
>>>> - 以上两个系统可以配合!
>>>>
>>>> 原先俺的设想是 MUNIN 监察,Nagios 报警;
>>>> 经池峰 提醒注意到了 Ganglia(钢两?) 也发现 Ganglia 的Python 扩展可以和Ngaios 的Python
>>>> 扩展接口良好配合起来,
>>>> 非常可爱!
>>>>
>>>> 但是! 找到的文章都是基于 Linux 平台的,俺的体系全部是 FreeBSD ,
>>>>
>>>
>>> 别用FreeBSD了。
>>>>
>>>> 咨询一下,是否有 BSD 平台中管理中心和监控节点的快速配置体验,分享一下?
>>>> 俺的主要问题:
>>>> - 如何在 Nginx 上发布 Nagios+Ganglia ?
>>>> - 如何通过ports 进行规范化安装?
>>>>    - Ganglia 是 /usr/ports/sysutils/ganglia-monitor-core +
>>>> ganglia-webfrontend ?
>>>>    - Nagios 是 /usr/ports/net-mgmt/nagios ?
>>>> - Nagios 的报警具体怎么配置的? 俺关注:
>>>>    - 主机的 CPU/内存/硬盘/电源 状态
>>>>    - 指定服务(web应用) 的状态
>>>>    如何不用 SNMP 来监察报警这些?




-- 
http://zoomquiet.org 人生苦短? Pythonic!
流程是对先前蠢行的内在反应! ~ Clay Shirky (Process is an embedded reaction to prior
stupidity)http://bit.l...

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-universe]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2024

    京ICP备05028076号